これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド グラインドです。
プログラム:
NAME
Grind - WordNet 辞書編集者ファイルを処理します
SYNOPSIS
グラインド [ -v ] [ -s ] [ -Lログファイル ] [ -a ] [ -d ] [ -i ] [ -o ] [ -n ] ファイル名 [
ファイル名...]
DESCRIPTION
グラインド() WordNet 辞書編集者ファイルを処理し、使用に適したデータベース ファイルを生成します
WordNet 検索およびインターフェイス コード、その他のアプリケーションを使用します。 構文と
入力ファイルの構造的整合性が検証されます。 警告とエラーは次の方法で報告されます。
stderr 実行時ログが生成されます (Linuxで言うところのstdout)。 データベースは、次の場合にのみ生成されます。
間違いはありません。
入力
入力ファイルは、WordNet に実装された構文カテゴリに対応します。 名詞, 動詞,
形容詞 副詞。 各入力辞書編集者ファイルは、同義語セットのリストで構成されます。
(シンセット) 品詞の XNUMX つ。 基本的な synset 構文はすべて同じですが、
品詞、構文の一部は特定の品詞にのみ適用されます。
詳細はこちら: w入力入力ファイル形式の説明については、(5WN) を参照してください。
各 ファイル名 指定された形式は次のとおりです。
パス名/投稿する.サフィックス
コラボレー パス名 オプションであり、 投稿する どちらかです 名詞, 動詞, adj or ADV. サフィックス 使用できます
synset のグループを異なるファイルに分割するには、たとえば 名詞.動物
名詞.植物。 XNUMX つ以上の入力ファイルは、構文カテゴリの任意の組み合わせで、
指定。 見る レックスネーム(5WN) を構築するために使用される辞書編集者ファイルのリストについては、
完全な WordNet データベース。
出力
グラインド() 次の出力ファイルが生成されます。
┌───────┬───────────── ────┐
│ ファイル名 │ 詳細説明 │
§───────┼───────────── ────┤
│インデックス。投稿する │ 構文カテゴリごとのインデックスファイル │
│データ。投稿する │ 構文カテゴリ別データファイル │
│インデックスセンス │ センスインデックス │
━───────┴───────────── ────┘
詳細はこちら: ワインデータベースデータベース ファイル形式の説明については、(5WN) を参照してください。
毎回 グラインド() を実行すると、既存のデータベース ファイルがデータベースで上書きされます。
指定された入力ファイルから生成されたファイル。 構文からの入力ファイルがない場合
カテゴリが指定されていても、対応するデータベース ファイルは上書きされません。
感覚 数字
一般に、感覚は使用頻度が最も高いものから最も低いものの順に並べられます。
番号付きの感覚 1。 使用頻度はセンスがタグ付けされた回数によって決まります
さまざまな意味的一致テキストで。 意味的にタグ付けされていない感覚が続く
順序付けられた感覚は任意の順序で配置されます。 この順序は単なる推定であることに注意してください
小規模なコーパスでの使用法に基づいています。
当学校区の タグセンス_cnt の各エントリのフィールド インデックス。投稿する ファイルは何個あるかを示します
リスト内の感覚にはタグが付けられています。
当学校区の cntlist データベースに付属のファイルには、各感覚がタグ付けされた回数がリストされています
意味上の一致において。 グラインド() からのデータを使用します cntlist ~の感覚に秩序を与える
各単語。 とき index.投稿する ファイルが生成されると、 synset_offsetは意味のある出力です
番号順。センス 1 がリストの先頭になります。 同じ数の意味を持つ感覚
タグには一意だが連続したセンス番号が割り当てられます。 ワードネット 概要 サーチ
指定された単語のすべての意味をすべての構文カテゴリで表示し、
意味的にタグ付けされたテキストでどの感覚が表現されているか。
OPTIONS
-v データベースを生成せずに入力の整合性を検証します。
-s 警告メッセージの生成を抑制します。 いつもの グラインド これで実行されます
すべての構文的および構造的エラーが修正されるまで、オプションを使用してください。
警告メッセージがあると、エラー メッセージを見つけるのが難しくなる場合があります。
-Lログファイル すべてのメッセージを次の宛先に書き込む ログファイル stderr.
-a 処理された入力ファイルに関する統計レポートを生成します。
-d 入力ファイルの文字列長による感覚の分布レポートを生成
処理されました。
-i センスインデックスファイルを生成します。
-o を使用した順序感覚 cntlist.
-n データベース内に名詞化 (派生形態) リンクを生成します。
ファイル名 で説明した形式の入力ファイル 入力 ファイル。
onworks.net サービスを使用してオンラインでグラインドを使用する