英語フランス語スペイン語

Ad


OnWorksファビコン

mmorph - クラウド上のオンライン

Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターを介して、OnWorks の無料ホスティング プロバイダーで mmorph を実行します。

これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド mmorph です。

プログラム:

NAME


mmorph - MULTEXT モルフォロジー ツール

SYNOPSIS


情報:
モーフ [ -vh ]

解析のみ:
モーフ -y | -z [ -a 追加ファイル ]
-m モーフファイル [ -d デバッグマップ ] [ -l ログファイル ] [ ファイル内 [ アウトファイル ]]

生成:
モーフ -c | -n [ -t トレースレベル ] [ -s トレースレベル ] [ -a 追加ファイル ]
-m モーフファイル [ -d デバッグマップ ] [ -l ログファイル ] [ ファイル内 [ アウトファイル ]]

簡単な検索:
モーフ [ -fi ] [ -b | -k ] [ -r リジェクトファイル ]
-m モーフファイル [ -d デバッグマップ ] [ -l ログファイル ] [ ファイル内 [ アウトファイル ]]

レコード/フィールドの検索:
モーフ -C クラス [ -fU ] [ -E | -O ] [ -b | [ -k ] [ -B class ]]
-m モーフファイル [ -d デバッグマップ ] [ -l ログファイル ] [ ファイル内 [ アウトファイル ]]

ダンプデータベース:
モーフ -p | -q
-m モーフファイル [ -d デバッグマップ ] [ -l ログファイル ] [ ファイル内 [ アウトファイル ]]

DESCRIPTION


最も単純な操作モードでは、 -m モーフファイル オプション、 モーフ で動作します
ルックアップ モード: という既存のデータベースを開きます。 モーフファイル.db そしてすべてを調べてください
入力内の文字列セグメント (通常は単語に対応)。

「morphfile」で指定された語彙エントリからデータベースを作成するには、次を使用します。 -c -m
モーフファイル。 ファイル モーフファイル.db 存在してはなりません。 データベースが完成すると、
入力内のセグメントを検索します。 非対話的に使用される場合 (入力と出力が端末である場合)、
プロンプトは、プログラムがユーザーにセグメント文字列の入力を要求したときに出力されます。 いいえ
プロンプトはレコード/フィールド モードで発生します。

で指定された語彙エントリに対するルールの適用をテストするには モーフファイルなし
データベースを作成し、セグメントを検索せずに使用します。 -n -m モーフファイル。 この
トレース レベルが指定されていない場合は、自動的にトレース レベルが 1 に設定されます。

上記と同じ操作を、字句エントリの代替セットに対して実行するには
in 追加ファイル、追加オプションを使用します -a 追加ファイル。 モーフファイル内の語彙エントリは次のようになります。
無視されました。 これは、標準的な形態学的記述に追加を行う場合に便利です。
データベースにエントリが追加されることに注意してください モーフファイル.db 既存のものを置き換えないでください。

認定条件 〜へ test a 形態学的 説明
-n オプション。 「文法」セクションで、目的の文に一致する目標ルールを指定します。
結果。 「語彙」セクションで、テストする語彙項目を指定します。 走行時
ルールが目的の場合、すべてのルールが語彙項目に (再帰的に) 適用されます。
アプリケーションの結果が出力に表示されます。

提案: 上記の XNUMX つの部分 (目標ルールと用語集セクション) を別々に置く
ファイルを作成し、これらのファイルを #include ディレクティブ内のどこに出現するか
メイン入力ファイル。

既存の説明を使用していて、新しい語彙エントリのみをテストしたい場合は、次を使用します。
オプション -n -a 追加ファイル、字句エントリを次のように入力します。 追加ファイル.

OPTIONS


-a 追加ファイル
モーフファイル内の語彙エントリを無視し、次から取得します。 追加ファイル を代わりにお使いください。

-B class
文の先頭より前に出現するレコード クラスを指定します。
このようなレコードの直後に出現する大文字の単語も、すべてのレコードで検索されます。
それらの文字は小文字に変換されます (LC_CTYPE に従って、以下を参照)。

-b 検索する前にケースを折りたたんでください。 大文字は小文字に変換されます
(LC_CTYPE に従って、以下を参照) 単語が検索される前。

-C クラス
レコード/フィールドモードを決定します。 検索する必要があるレコード クラスを指定します
上。 クラス名はカンマ「,」、TAB、スペース、バー「|」で区切る必要があります。 またはバックスラッシュ
「\」。

-c ルックアップ用に新しいデータベースを作成します。 作成されたファイルの名前は、
モーフファイル (-m オプション) サフィックス付き .db。 それは存在すべきではありません。 存在する場合はユーザー
実行する前に手動で削除する必要があります モーフ -c (これは最低限の保護です
長い時間がかかった可能性のあるデータベースを誤って上書きすることを防ぎます。
作成する)。

-d デバッグマップ
必要なデバッグ オプションを指定します。 それぞれのビット デバッグマップ に相当する
オプションを選択します。
ビット XNUMX 進数 XNUMX 進数 目的
ビットなし 0 0x0 デバッグ オプションなし (デフォルト)
1 1 0x1 デバッグ初期化
2 2 0x2 デバッグ yacc 解析
3 4 0x4 デバッグ ルールの組み合わせ
4 8 0x8 デバッグ スペル アプリケーション
5 16 0x10 -p または -q オプションを使用した統計の出力
すべてのビット -1 0xffff すべてのデバッグ オプション
オプションを組み合わせるには、0 進値または 5 進値を加算します。 例: -t XNUMXxXNUMX
ビット (オプション) 1 および 4 を指定します。

-E レコード/フィールド モードでは、形態論注釈がすでに存在する場合、それを拡張します (
デフォルトでは、既存の注釈をそのまま残します)。

-O レコード/フィールド モードでは、形態注釈がすでに存在する場合は上書きします。
(デフォルトでは、既存の注釈はそのまま残されます)。

-f 各セグメントの検索後に出力をフラッシュします。 これは入力と出力の場合にのみ役立ちます。
同期する必要があるプログラムとの間でパイプ処理されます。

-h ヘルプを印刷して終了します。

-i 各ルックアップの結果の前に入力セグメントの識別子を追加します。
に対応。 現在入力されているセグメントは連番で識別されます。
0 から始まります。この表示では、ソリューションを区切る追加の改行が
異なる入力セグメントの は必要ないため、出力されません。 ルックアップの場合
には解はなく、セグメント識別子のみが出力に出力されます。 セグメント
識別子は、拒否されたセグメントの前にも付加されます。 タブは常に次の後に続きます。
セグメント識別子。

-k フォールバックフォールドケース。 単語の検索が失敗した場合は、すべての大文字を次のように変換します。
小文字にして検索を再試行してください。 (変換は LC_CTYPE に従って行われます。を参照してください。
下)。

-l ログファイル
トレースおよびエラー メッセージを書き込むファイルを指定します。 デフォルトは標準エラーです。

-m モーフファイル
形態記述を含むファイルを指定します。 見る モーフ (5) のために
形式主義の構文の説明。

-n データベースの作成や検索は行われません (テスト モード)。

-p 型指定された特徴構造データベースを出力ファイル (または標準出力) にダンプします。 の
デバッグのビット 5 の場合、個別の tfs の数がログファイル (または標準エラー) に示されます。
オプションが設定されています。

-q データベース内のフォームを出力ファイル (または標準出力) にダンプします。 いくつかの統計
デバッグ オプションのビット 5 が設定されている場合、ログファイル (または標準エラー) に記録されます。

-r リジェクトファイル
非レコード/フィールド モードでは、入力セグメントを書き込むファイルを指定します。
調べることができませんでした。 デフォルトは標準エラーです。

-s トレースレベル
スペル ルールの適用をトレースします。
0 トレースなし (デフォルト)。
1 有効な表面形状をトレースします。
語彙部分が一致する 2 つのトレース ルール。
3 トレース表面左コンテキスト一致 (表面単語構築)。
4 トレース サーフェスの右コンテキストの不一致とルールのブロック。
5 非ブロッキング トレース ルール。
トレースレベルは、それより前のすべてのレベルを意味します。

-t トレースレベル
ルール適用のトレースのレベルを指定します。
0 トレースなし (デフォルト)。
1 適用されるトレース ゴール ルール。
2 適用されるすべてのルールをトレースします。インデントは再帰の深さを示します。
10 試行されたが適用されなかったルールも追跡します
トレースレベルは、それより前のすべてのレベルを意味します。

-U レコード/フィールド モードでは、未知の単語 (つまり、検索に失敗した単語) が表示されます。
??\?? の注釈が付けられています。

-v バージョンを印刷して終了します。

-y 解析のみ: 構文チェック以外の説明を処理しません。 その間
形態論の記述を作成する場合、このオプションを使用して構文エラーを検出できます。
各変更後、「実際に」実行する前にすぐに実行してください。

-z -y を意味します。 正規化された形式で語彙の説明を解析して出力します。

ファイル内 ルックアップするセグメントを XNUMX 行に XNUMX つずつ含むファイル。 デフォルトは標準
入力。

アウトファイル
プログラムの出力が書き込まれるファイル。 ソリューションごとに XNUMX 行。
異なる入力セグメントのソリューションは空行で区切られます。 デフォルトは
標準出力。

WORD 文法 そして つづり RULES


で使用される原理とメカニズムの詳細な説明については、 モーフ、 参照してください
以下の「関連項目」セクションで引用されているドキュメント。

簡単にスケッチした、mmorph 用に書かれた形態統語論的記述は、単語がどのように機能するかを説明します。
形態素の連結によって構築される、およびこの連結プロセスがどのように変化するか
これらの形態素のスペル。 最初の部分である単語構造文法を指定します。
形式主義が統一ベースに触発された制限付きコンテキスト自由書き換えルールによる
システム (Shieber 1986 を参照)。 XNUMX 番目の部分であるスペルの変更は、次のように指定されます。
形態学の XNUMX レベル モデルに基づいた形式主義におけるスペル ルール。 このアプローチ
形態学への詳細は、Ritchie、Russell et. al、1992、およびプルマンでより簡潔に
とヘプル 1993。

ENVIRONMENT 変数


どの文字を出力に表示できるかを決定するには、 モーフ 言語を使用します
という具体的な説明 ロケールの設定(3) 環境変数に従って設定します
LC_CTYPE。 MULTEXT で扱われる言語については、これを用意しておくことをお勧めします。
変数をに設定 iso_8859_1。


以下は、mmorph オプションの一般的な使用法の概要です。

モーフ -n -m モーフファイル
テスト モード: モーフファイル全体を読み取り、結果を標準エラーに出力します。 データベースなし
が作成されますが、単語は検索されません。

モーフ -c -m モーフファイル
データベースの作成: モーフファイル全体を読み取り、結果をデータベースに保存します。
(morphfile.db)。 型付き特徴構造は別のファイルに収集されます
(モーフファイル.tfs)。 新しいデータベースで検索する単語については、標準入力が読み取られます。

モーフ -m モーフファイル
ルックアップ モード: モーフファイルのアルファベット、属性、およびタイプのセクションのみを読み取ります。
既存のデータベースに従って検索する単語の標準入力が読み取られます。
(mmorphfile.db および morphfile.tfs)。

モーフ -m モーフファイル -a 追加ファイル
追加モード: morphfile の Lexicon セクションを無視しますが、addfile は参照されます。
結果はデー​​タベースに追加されます。 検索する単語の標準入力が読み取られます
拡張データベース (mmorphfile.db および morphfile.tfs) に従ってください。

診断


エラー メッセージは一目瞭然である必要があります。 を参照してください。 モーフ(5) 正式な場合
構文の説明。

onworks.net サービスを使用してオンラインで mmorph を使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

Linuxコマンド

Ad