英语法语西班牙语

Ad


OnWorks 网站图标

htdump - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 htdump

这是命令 htdump,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


htdump - 写出文档数据库的 ASCII 文本版本

概要


转储 [选项]

商品描述


Htdump 以与
htdig 的 -t 选项。

配置


-a 使用备用工作文件。 告诉 htdump 追加 。工作 到数据库文件,允许
它对第二组数据库进行操作。

-c 配置文件
使用指定的 配置文件 而不是默认值。

-v 详细模式。 这没有太大的影响。

文件 格式


文件 数据库
文件中的每一行都以文档 id 开头,后跟一个列表 字段名 :
折扣值 由制表符分隔。 这些字段始终按下面列出的顺序显示:

u 网址

t 标题

a 状态(0 = 正常,1 = 未找到,2 = 未编入索引,3 = 已过时)

m 服务器报告的最后修改时间

s 大小(以字节为单位)

H 摘抄

h Meta描述

l 最后检索时间

L 文档中的链接数(传出链接)

b 指向文档的链接数(传入链接或反向链接)

c 本文档的 HopCount

g 用于重复检测的文件签名

e 用于来自 htnotify 的通知消息的电子邮件地址

n 发送通知电子邮件的日期

S 通知电子邮件的主题

d 指向本文档的链接文本。 (例如 <a
href="/docURL">说明 )

A 文档中的锚点(即

Word 数据库
虽然 htdump 和 htload 不直接处理数据库这个词,但值得
在这里提到它是因为您在复制 ASCII 时需要处理它
数据库从一个系统到另一个系统。 htdig出品的初始词库
已经是 ASCII 格式,它的二进制版本是由 htmerge 生成的,用于
由 htsearch 使用。 因此,当您复制文档数据库的 ASCII 版本时
由 htdump 生成,您还需要复制 wordlist,然后运行 ​​htload 以
在目标系统上制作二进制文档数据库,然后运行 ​​htmerge
使单词索引。

单词列表文件中的每一行都以单词开头
接着是一个列表 字段名 : 折扣值 由制表符分隔。 字段总是出现
按照下面列出的顺序,最后两个是可选的:

i 文件编号

l 文档中单词的位置(1 到 1000)

w 基于评分因素的词权重

c 单词在文档中出现的次数,如果超过 1

a 如果单词出现在命名锚之后,则锚编号

使用 onworks.net 服务在线使用 htdump


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad