英語フランス語スペイン語

Ad


OnWorksファビコン

dictzip - クラウド上のオンライン

Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーター上の OnWorks 無料ホスティング プロバイダーで dictzip を実行します。

これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド dictzip です。

プログラム:

NAME


dictzip、dictunzip - ファイルを圧縮 (または展開) し、ランダム アクセスを許可します。

SYNOPSIS


辞書ジップ [オプション]
辞書圧縮 [オプション]

DESCRIPTION


辞書ジップ を使用してファイルを圧縮します gzip(1) アルゴリズム (LZ77) は次のとおりです。
と完全に互換性があります gzip ファイル形式。 の拡張 gzip ファイル形式
(追加フィールド、RFC 2.3.1.1 の 1952 に記載) により、追加のデータを
圧縮ファイルのヘッダー。 のようなプログラム gzip & zcat この余分なデータは無視されます。
しかしながら、 口述(8)、DICT プロトコル辞書サーバーはこのデータを利用して、
ファイルに対して擬似ランダムアクセスを実行します。 内のファイル 辞書ジップ 形式は「.dz」で終わる必要があります
一般的なものと区別できるように gzip 特殊なファイルが含まれていないファイル
ヘッダー情報。

RFC 1952 では、追加フィールドは次のように指定されています。

FLG.FEXTRA ビットが設定されている場合、ヘッダーに「追加フィールド」が存在し、合計
長さはXLENバイトです。 これは、それぞれ次の形式の一連のサブフィールドで構成されます。

+---+---+---+---+================================= =+
|SI1|SI2| LEN |... サブフィールド データの LEN バイト ...|
+---+---+---+---+================================= =+

SI1 と SI2 はサブフィールド ID を提供します。通常は、ニーモニックを備えた XNUMX つの ASCII 文字です。
価値。 ジャン=ルー・ゲイリー[メール保護]> のレジストリを管理しています
サブフィールドID。 使用したいサブフィールド ID を彼に送ってください。 サブフィールド ID と
SI2 = 0 は将来の使用のために予約されています。

LEN は、最初の 4 バイトを除いたサブフィールド データの長さを示します。

  辞書ジップ プログラムは SI1 に「R」を使用し、SI2 に「A」を使用します (つまり、「ランダム アクセス」)。 後に
LEN フィールドでは、データは次のように配置されます。

+---+---+---+---+---+---+========================= ======+
| バージョン | クレン | CHCNT | ... データの CHCNT ワード ... |
+---+---+---+---+---+---+========================= ======+

RFC 1952 に従って、すべてのデータは最下位バイトから最初に格納されます。 データのVER1については、
すべての値は 16 ビット長 (2 バイト) で、符号なし整数です。

XLEN (ヘッダーの前半で指定) は XNUMX バイトの整数であるため、追加のフィールドは
長さは 0xffff バイトで、そのうちの 2 バイトはサブフィールド ID (SI1 および SI1) に使用されます。
そのうちの 2 バイトはサブフィールド長 (LEN) に使用されます。 これにより、0xfffb バイト (0x7ffd) が残ります。
2 バイト エントリまたは 0x3ffe 4 バイト エントリ)。 zip 出力バッファーが 10% + でなければならないとすると、
入力バッファより 12 バイト大きく、エントリごとに 58969 バイト、つまり約 1.8GB を保存できます。
2 バイトのエントリが使用されている場合。 これが制限要因になる場合は、別の形式のバージョン
4 バイトのエントリに対して選択および定義できます。

圧縮の場合、ファイルはデータの「チャンク」に分割されます。各チャンクは以下のサイズよりも小さくなります。
64kB であり、64kB 未満の長さの領域に圧縮することもできます (
非圧縮データを考慮する -- 通常、データはブロックに圧縮されます。
オリジナルよりかなり小さい)。 CHLEN フィールドは、「チャンク」の長さを指定します。
データ。 CHCNT フィールドは、プリセットされるチャンクの数とデータの CHCNT ワードを指定します。
圧縮後 (つまり、現在の圧縮ファイル内) の各チャンクの長さを指定します。

データに対してランダム アクセスを実行するには、データのオフセットと長さが次のように提供されます。
図書館のルーティン。 これらのルーチンは、目的のデータが始まるチャンクを決定します。
そしてそのチャンクを解凍します。 連続したチャンクは必要に応じて解凍されます。

トレードオフ


速度 たとえ XNUMX バイトであっても、あらゆるアクセスが行われるため、真のランダム ファイル アクセスは実現されません。
64kB のチャンクを読み取って解凍する必要があります。 これはアクセスするよりも遅いです
フラット テキスト ファイルですが、完全なテキスト ファイルでシリアル アクセスを実行するよりもはるかに高速です。
圧縮ファイル。

スペース 私たちが取り組んでいるテキスト辞書データベースでは、64kB のチャンクが使用されています。
最大の LZ77 圧縮により、ファイルは以前のファイルよりわずか約 4% 大きくなります。
同じファイルを一度に圧縮します。

OPTIONS


-d or -解凍
解凍します。 これは、実行可能ファイルが呼び出された場合のデフォルトです。 辞書圧縮.

-c or --stdout
出力を標準出力に書き込みます。 元のファイルは変更しないでください。 これだけです
解凍時に使用できます(ヘッダーの一部は解凍後に更新する必要があるため)
圧縮時に書き込みます)。

-f or - 力
出力ファイルがすでに存在する場合でも、強制的に圧縮または解凍します。

-h or - 助けて
ヘルプを表示します。

-k or - 保つ
元のファイルは削除しないでください。

-l or - リスト
圧縮ファイルごとに、次のフィールドをリストします。

タイプ: dzip、gzip、または text (不明な形式のファイルを含む)
crc: CRCチェックサム
日付と時刻: ヘッダーから
チャンク: ファイル内のチャンクの数
size: 非圧縮の各チャンクのサイズ
comp.: 圧縮サイズ
uncompr.: 非圧縮サイズ
比率:圧縮率(不明な場合は0.0%)
name: 非圧縮ファイルの名前

取消 gzip、圧縮方式が検出されません。

-L or - ライセンス
表示する 辞書ジップ ライセンスを取得して終了します。

-t or - テスト
圧縮ファイルの整合性をチェックします。 このオプションは実装されていません。 代わりに、それは
ヘッダー情報がリストされます。

-v or -詳細
冗長。 圧縮中に追加情報を表示します。

-V or - バージョン
バージョン。 バージョン番号とコンパイルオプションを表示して、終了します。

-s start or - 始める start
解凍を開始するオファーを XNUMX 進数で指定します。 デフォルトは次のとおりです
ファイルの先頭。

-e サイズ or - サイズ サイズ
ファイルの解凍する部分のサイズを XNUMX 進数で指定します。
デフォルトはファイル全体です。

-S start or - 始める start
Base64 番号を使用して、解凍を開始するオファーを指定します。 デフォルトは次のとおりです
ファイルの先頭。

-E サイズ or - サイズ start
Base64 数値を使用して、解凍するファイル部分のサイズを指定します。
デフォルトはファイル全体です。

-p プレフィルター or --pre プレフィルター
圧縮または解凍の前にフィルタとして実行するシェルコマンドを指定します。
塊の。 圧縮前および圧縮後のフィルタを使用して、次のことを行うことができます。
追加の圧縮または出力フォーマット。 フィルタでは増加しない可能性があります
バッファサイズが大幅に増加します。 圧縮前および圧縮後のフィルターは、次のように設計されています。
可能な限り最も一般的なインターフェイスを提供します。

-P ポストフィルター or - 役職 ポストフィルター
圧縮または解凍後にフィルタとして実行するシェルコマンドを指定します。

CREDITS


辞書ジップ リク・フェイス ([メール保護]) の条件に基づいて配布されています。
GNU 一般公衆利用許諾書。 他の条件で配布する必要がある場合は、次の宛先に書面でご連絡ください。
著者。

このプログラムで使用される主なライブラリ (zlib、regex、libmaa) は以下で配布されています。
用語が異なるため、次のようなアプリケーションにライブラリを使用できる場合があります。
GPL と互換性がありません -- 著作権表示とライセンス情報を参照してください。
詳細については図書館に行き、解決するには弁護士に相談してください。
これらの問題。

onworks.net サービスを使用してオンラインで dictzip を使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

Linuxコマンド

Ad