Jest to polecenie htload, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
htload - odczytuje wersję tekstową ASCII bazy danych dokumentów
STRESZCZENIE
wczytaj [opcje]
OPIS
Htload odczytuje wersję tekstową ASCII bazy danych dokumentów w tej samej formie, co plik
-t opcja htdig i htdump. Pamiętaj, że spowoduje to nadpisanie danych w Twoich bazach danych,
dlatego należy go używać z dużą ostrożnością.
OPCJE
-a Użyj alternatywnych plików roboczych. Informuje htload o dołączeniu .praca do plików baz danych, umożliwiając
do działania na drugim zestawie baz danych.
-c plik konfiguracyjny
Użyj podanego plik konfiguracyjny zamiast domyślnego.
-i Wstępny. Nie używaj żadnych starych baz danych. Osiąga się to poprzez wcześniejsze usunięcie pliku
bazy danych.
-v Tryb szczegółowy. Nie ma to większego wpływu.
filet Formaty
dokument Baza danych
Każda linia w pliku zaczyna się od identyfikatora dokumentu, po którym następuje lista Nazwa pola :
wartość oddzielone tabulatorami. Pola zawsze pojawiają się w poniższej kolejności:
u URL
t Tytuł
a Stan (0 = normalny, 1 = nie znaleziono, 2 = nieindeksowany, 3 = przestarzały)
m Czas ostatniej modyfikacji zgłoszony przez serwer
s Rozmiar w bajtach
H Fragment
h Meta opis
l Godzina ostatniego pobrania
L Liczba linków w dokumencie (linki wychodzące)
b Liczba linków do dokumentu (linki przychodzące lub linki zwrotne)
c HopCount tego dokumentu
g Podpis dokumentu używanego do wykrywania duplikatów
e Adres e-mail, na który chcesz wysyłać powiadomienia z htnotify
n Data wysłania wiadomości e-mail z powiadomieniem
S Temat wiadomości e-mail z powiadomieniem
d Tekst linków prowadzących do tego dokumentu. (np. <a
href="/docURL">opis )
A Kotwice w dokumencie (tj
słowo Baza danych
Chociaż htdump i htload nie zajmują się bezpośrednio bazą danych słów, warto
wspominając o tym tutaj, ponieważ musisz sobie z tym poradzić podczas kopiowania ASCII
baz danych z jednego systemu do drugiego. Początkowa baza danych słów stworzona przez htdig
jest już w formacie ASCII, a jego wersja binarna jest tworzona przez htmerge, dla
użyj przez htsearch. Tak więc, gdy kopiujesz wersję ASCII bazy danych dokumentów
utworzone przez htdump, musisz skopiować także listę słów, a następnie uruchomić htload do
utwórz binarną bazę danych dokumentów w systemie docelowym, a następnie uruchom htmerge
aby utworzyć indeks słów.
Każda linia w pliku listy słów zaczyna się od słowa
po którym następuje lista Nazwa pola : wartość oddzielone tabulatorami. Pola pojawiają się zawsze
w kolejności podanej poniżej, przy czym dwa ostatnie są opcjonalne:
i Identyfikator dokumentu
l Lokalizacja słowa w dokumencie (1 do 1000)
w Waga słowa na podstawie czynników punktacji
c Liczba wystąpień słowa w dokumencie, jeśli jest ich więcej niż 1
a Numer kotwicy, jeśli słowo występuje po nazwanej kotwicy
Użyj htload online, korzystając z usług onworks.net