Це команда htdump, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS.
ПРОГРАМА:
ІМ'Я
htdump - виписати текстову версію ASCII бази даних документів
СИНТАКСИС
htdump [параметри]
ОПИС
Htdump записує текстову версію бази даних документів у форматі ASCII у тій же формі, що й файл
-t варіант htdig.
ВАРІАНТИ
-a Використовуйте альтернативні робочі файли. Вказує htdump додати .робота до файлів бази даних, що дозволяє
це для роботи з другим набором баз даних.
-c конфігураційний файл
Використовуйте зазначене конфігураційний файл замість стандартного.
-v Детальний режим. Це не має великого ефекту.
філе Формати
Документ Database
Кожен рядок у файлі починається з ідентифікатора документа, за яким слідує список ім'я поля :
значення розділені табуляціями. Поля завжди відображаються в порядку, наведеному нижче:
u URL
t назва
a Стан (0 = нормальний, 1 = не знайдено, 2 = не проіндексовано, 3 = застарілий)
m Час останньої зміни, який повідомляє сервер
s Розмір у байтах
H Витримка
h Мета опис
l Час останнього вилучення
L Кількість посилань у документі (вихідні посилання)
b Кількість посилань на документ (вхідні посилання або зворотні посилання)
c HopCount цього документа
g Підпис документа, що використовується для виявлення дублікатів
e Адреса електронної пошти для сповіщення від htnotify
n Дата надсилання повідомлення електронною поштою
S Тема для повідомлення електронної пошти
d Текст посилань, що вказують на цей документ. (наприклад, <a
href="/docURL">опис )
A Якоря в документі (тобто
слово Database
Хоча htdump і htload не мають справу з базою даних слова безпосередньо, це того варто
згадуючи це тут, тому що вам потрібно мати справу з цим під час копіювання ASCII
бази даних з однієї системи в іншу. Початкова база даних слів, створена htdig
вже у форматі ASCII, і його двійкова версія створюється htmerge, for
використовувати htsearch. Отже, при копіюванні ASCII-версії бази даних документів
створений htdump, вам також потрібно скопіювати список слів, а потім запустити htload до
створіть базу даних двійкових документів у цільовій системі, а потім запустіть htmerge
щоб скласти індекс слова.
Кожен рядок у файлі списку слів починається зі слова
далі йде список ім'я поля : значення розділені табуляціями. Поля завжди з'являються
у порядку, наведеному нижче, причому останні два є необов’язковими:
i Ідентифікатор документа
l Розташування слова в документі (від 1 до 1000)
w Вага слова на основі коефіцієнтів оцінки
c Кількість зустрічей слова в документі, якщо їх більше 1
a Номер прив’язки, якщо слово стоїть після названого прив’язки
Використовуйте htdump онлайн за допомогою служб onworks.net