これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド htdump です。
プログラム:
NAME
htdump - ドキュメント データベースの ASCII テキスト バージョンを書き出す
SYNOPSIS
htdump [オプション]
DESCRIPTION
Htdump は、ドキュメント データベースの ASCII テキスト バージョンを、
htdig の -t オプション。
OPTIONS
-a 代替作業ファイルを使用してください。 htdump に追加するように指示します 。作業 データベースファイルに、
データベースのXNUMX番目のセットで動作します。
-c 構成ファイル
指定されたものを使用してください 構成ファイル デフォルトの代わりに。
-v 冗長モード。 これはあまり効果がありません。
File フォーマット
ドキュメント データベース
ファイルの各行は、ドキュメントIDで始まり、その後に次のリストが続きます。 フィールド名 :
値 タブで区切られます。 フィールドは常に以下の順序で表示されます。
u URL
t 役職
a 状態(0 =正常、1 =見つからない、2 =インデックスが作成されていない、3 =廃止されている)
m サーバーによって報告された最終変更時刻
s バイト単位のサイズ
H 抜粋
h メタ記述
l 最後の取得時刻
L ドキュメント内のリンクの数(送信リンク)
b ドキュメントへのリンクの数(受信リンクまたはバックリンク)
c このドキュメントのHopCount
g 重複検出に使用されるドキュメントの署名
e htnotifyからの通知メッセージに使用する電子メールアドレス
n 通知メールを送信する日付
S 通知電子メールメッセージの件名
d このドキュメントを指すリンクのテキスト。 (例:<a
href = "/ docURL">説明)
A ドキュメント内のアンカー(つまり
Word データベース
htdumpとhtloadは単語データベースを直接処理しませんが、それは価値があります
ASCIIをコピーするときに対処する必要があるため、ここで言及します
あるシステムから別のシステムへのデータベース。 htdigによって作成された最初の単語データベース
はすでにASCII形式であり、そのバイナリバージョンはhtmergeによって生成されます。
htsearchによる使用。 したがって、ASCIIバージョンのドキュメントデータベースをコピーする場合
htdumpによって生成された場合、ワードリストもコピーしてから、htloadを実行して
ターゲットシステムでバイナリドキュメントデータベースを作成し、続いてhtmergeを実行します
単語のインデックスを作成します。
単語リストファイルの各行は、単語で始まります
のリストが続きます フィールド名 : 値 タブで区切られます。 フィールドは常に表示されます
以下にリストされている順序で、最後のXNUMXつはオプションです。
i ドキュメントID
l ドキュメント内の単語の場所(1から1000)
w スコアリングファクターに基づく単語の重み
c 1を超える場合は、ドキュメント内の単語の出現数
a 名前付きアンカーの後に単語が出現した場合のアンカー番号
onworks.net サービスを使用してオンラインで htdump を使用する