Jest to polecenie hxextract, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
hxextract - wyodrębnia wybrane elementy z pliku HTML lub XML
STRESZCZENIE
ekstrakt hx [ -h | -? ] [ -x ] [ -s XNUMX ] [ -e XNUMX ] [ -b baza ] element lub klasa [ -c
plik konfiguracyjny | plik-lub-URL ]
OPIS
ekstrakt hx wyświetla wszystkie elementy o określonej nazwie i/lub klasie.
Dane wejściowe muszą być dobrze sformułowane, ponieważ nie są stosowane żadne heurystyki HTML.
OPCJE
Obsługiwane są następujące opcje:
-x Używaj konwencji formatu XML.
-s XNUMX wstawka XNUMX na początku wyjścia.
-e XNUMX wstawka XNUMX na końcu wyjścia.
-b baza Baza adresów URL
-c plik konfiguracyjny
Przeczytaj wiersze @rozdziału z plik konfiguracyjny (linie muszą mieć postać „@chapter
filename”) i wyodrębnij elementy z każdego z tych plików.
-h, -? Użycie polecenia drukowania.
OPERANDY
Obsługiwane są następujące argumenty:
element lub klasa
Nazwa elementu do wyodrębnienia (np. „H2”) lub poprzedzona nazwa klasy
przez "." (np. „.przykład”) lub kombinację obu (np. „H2.przykład”).
plik-lub-URL
Nazwa pliku lub adres URL. Aby odczytać ze standardowego wejścia, użyj „-”.
ŚRODOWISKO
Aby użyć proxy do pobierania zdalnych plików, ustaw zmienne środowiskowe http Proxy i
ftp_proxy. Np, http_proxy="http://localhost:8080/"
Użyj hxextract online, korzystając z usług onworks.net