这是命令 htdump,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
htdump - 写出文档数据库的 ASCII 文本版本
概要
转储 [选项]
商品描述
Htdump 以与
htdig 的 -t 选项。
配置
-a 使用备用工作文件。 告诉 htdump 追加 。工作 到数据库文件,允许
它对第二组数据库进行操作。
-c 配置文件
使用指定的 配置文件 而不是默认值。
-v 详细模式。 这没有太大的影响。
文件 格式
文件 数据库
文件中的每一行都以文档 id 开头,后跟一个列表 字段名 :
折扣值 由制表符分隔。 这些字段始终按下面列出的顺序显示:
u 网址
t 标题
a 状态(0 = 正常,1 = 未找到,2 = 未编入索引,3 = 已过时)
m 服务器报告的最后修改时间
s 大小(以字节为单位)
H 摘抄
h Meta描述
l 最后检索时间
L 文档中的链接数(传出链接)
b 指向文档的链接数(传入链接或反向链接)
c 本文档的 HopCount
g 用于重复检测的文件签名
e 用于来自 htnotify 的通知消息的电子邮件地址
n 发送通知电子邮件的日期
S 通知电子邮件的主题
d 指向本文档的链接文本。 (例如 <a
href="/docURL">说明 )
A 文档中的锚点(即
Word 数据库
虽然 htdump 和 htload 不直接处理数据库这个词,但值得
在这里提到它是因为您在复制 ASCII 时需要处理它
数据库从一个系统到另一个系统。 htdig出品的初始词库
已经是 ASCII 格式,它的二进制版本是由 htmerge 生成的,用于
由 htsearch 使用。 因此,当您复制文档数据库的 ASCII 版本时
由 htdump 生成,您还需要复制 wordlist,然后运行 htload 以
在目标系统上制作二进制文档数据库,然后运行 htmerge
使单词索引。
单词列表文件中的每一行都以单词开头
接着是一个列表 字段名 : 折扣值 由制表符分隔。 字段总是出现
按照下面列出的顺序,最后两个是可选的:
i 文件编号
l 文档中单词的位置(1 到 1000)
w 基于评分因素的词权重
c 单词在文档中出现的次数,如果超过 1
a 如果单词出现在命名锚之后,则锚编号
使用 onworks.net 服务在线使用 htdump