To aplikacja dla systemu Linux o nazwie Parsera, której najnowszą wersję można pobrać jako v0.2.6sourcecode.tar.gz. Można ją uruchomić online na bezpłatnym hostingu OnWorks dla stacji roboczych.
Pobierz i uruchom bezpłatnie aplikację Parsera z OnWorks.
Postępuj zgodnie z tymi instrukcjami, aby uruchomić tę aplikację:
- 1. Pobrałem tę aplikację na swój komputer.
- 2. Wpisz w naszym menedżerze plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 3. Prześlij tę aplikację w takim menedżerze plików.
- 4. Uruchom emulator online OnWorks Linux lub Windows online lub emulator online MACOS z tej witryny.
- 5. W systemie operacyjnym OnWorks Linux, który właśnie uruchomiłeś, przejdź do naszego menedżera plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 6. Pobierz aplikację, zainstaluj ją i uruchom.
ZDJĘCIA EKRANU:
Parsera
OPIS:
Zbieraj dane z dowolnej strony internetowej, mając jedynie link i opisy kolumn. Parsera to narzędzie przeznaczone do zbierania treści internetowych, w szczególności ze stron o słabej strukturze lub chaotycznym układzie.
Funkcjonalności
- Narzędzie do scrapowania stron internetowych w celu wyodrębniania danych z trudnych witryn
- Skutecznie radzi sobie z chaotycznymi strukturami HTML
- Obsługuje zaawansowane reguły analizy składniowej
- Ekstrahuje ustrukturyzowane dane z nieustrukturyzowanych źródeł
- Zapewnia elastyczne formaty wyjściowe (CSV, JSON)
- Możliwość dostosowania wzorców ekstrakcji
Język programowania
Python
Kategorie
Tę aplikację można również pobrać ze strony https://sourceforge.net/projects/parsera.mirror/. Została ona umieszczona w OnWorks, aby można ją było najłatwiej uruchomić online z poziomu jednego z naszych darmowych systemów operacyjnych.