Это команда htload, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
htload - читает в текстовой версии ASCII базы данных документа
СИНТАКСИС
htload [опции]
ОПИСАНИЕ
Htload читает текстовую версию базы данных документа в формате ASCII в той же форме, что и
-t опция htdig и htdump. Обратите внимание, что это перезапишет данные в ваших базах данных,
поэтому использовать его следует с большой осторожностью.
ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ
-a Используйте альтернативные рабочие файлы. Сообщает htload добавить .Работа в файлы базы данных, что позволяет
он должен работать со вторым набором баз данных.
-c файл конфигурации
Используйте указанный файл конфигурации вместо значения по умолчанию.
-i Исходный. Не используйте старые базы данных. Это достигается путем стирания
базы данных.
-v Подробный режим. Это не имеет большого эффекта.
Файл Форматы
Документ База данных
Каждая строка в файле начинается с идентификатора документа, за которым следует список имя поля :
ценностное разделенные табуляцией. Поля всегда появляются в следующем порядке:
u URL
t Название
a Состояние (0 = нормальное, 1 = не найдено, 2 = не проиндексировано, 3 = устарело)
m Время последней модификации, сообщенное сервером
s Размер в байтах
H выдержка
h Мета описание
l Время последнего извлечения
L Количество ссылок в документе (исходящие ссылки)
b Количество ссылок на документ (входящих или обратных)
c HopCount этого документа
g Подпись документа, используемого для обнаружения дубликатов
e Адрес электронной почты для отправки уведомления от htnotify
n Дата отправки уведомления по электронной почте
S Тема сообщения электронной почты с уведомлением
d Текст ссылок, указывающих на этот документ. (например, <a
href = "/ docURL"> описание)
A Якоря в документе (т.е.
Word База данных
Хотя htdump и htload не работают напрямую со словарной базой данных, стоит
упоминая об этом здесь, потому что вам нужно иметь дело с этим при копировании ASCII
базы данных из одной системы в другую. Исходная база данных слов, созданная htdig
уже находится в формате ASCII, и его двоичная версия создается htmerge для
использование htsearch. Итак, когда вы копируете версию базы данных документов в формате ASCII
созданный htdump, вам также нужно скопировать список слов, а затем запустить htload, чтобы
создать базу данных двоичных документов в целевой системе, а затем запустить htmerge
сделать индекс слова.
Каждая строка в файле списка слов начинается со слова
за которым следует список имя поля : ценностное разделенные табуляцией. Поля всегда появляются
в порядке, указанном ниже, причем последние два являются необязательными:
i ID документа
l Расположение слова в документе (от 1 до 1000)
w Вес слова на основе оценочных факторов
c Количество появлений слова в документе, если больше 1
a Номер привязки, если слово появилось после именованной привязки
Используйте htload онлайн с помощью сервисов onworks.net