これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド Chasen です。
プログラム:
NAME
茶筅 ‐ 日本語形態素解析システム
SYNOPSIS
追いかけられた [オプション] file
DESCRIPTION
追いかけられた 形態素解析システムです。 日本語テキストをセグメント化してトークン化することができます
文字列であり、多くの追加情報 (発音、意味) を含めて出力できます。
情報など)。
このような操作の結果を標準出力に出力します。
ファイルに書き込まれるか、さらに処理されます。
OPTIONS
-s 分析には部分文モードを使用します。
-j 分析には日本語文章モードを使用します。 区点(その他の句読点を含む)
および空行はテキストの句読点として扱われます。
-C 分析にはコマンド モードを使用します。
-b 最適なパスを示します。 (デフォルト)
-m 最適なパスで曖昧さが特定されたすべての形態素を表示します。
-p 曖昧さのすべての組み合わせに対して展開されるすべてのパスを表示します。
-f 書式設定された形態素データを列に表示します (デフォルト)
-e 形態素データ全体を表示します。
-c コード化された形態素データを表示します。
-d Prolog で使用する詳細な形態素を表示します。
-v VisualMorphs で使用する詳細な形態素を表示します。
-O[c|s]
形態素を複合語またはその分節として表示します。
-F 形式でアーカイブしたプロジェクトを保存します.
によってフォーマットされた形態素を表示します。 形式でアーカイブしたプロジェクトを保存します. "%m\t%y\t%M\t%U(%P-)\t%T \t%F \n" など。
-Fh ヘルプ情報を印刷する -F オプションを選択します。
-i 長い
入力ファイルの文字コードを指定します。 e:EUC-JP、s:シフトJIS、w:UTF-8、
u:UTF-8、a:ISO-8859-1
-o file
出力ファイルを指定します file .
-w 幅
コスト幅を指定します。
-r rcファイル
rcファイル Chasenrc ファイルとして。
-R システムのデフォルトのchasenrc ファイル (/etc/chasenrc) を使用します。
-L 長い
言語を指定します。
-lp 品詞リストを印刷します。
-lt 活用型のリストを出力します。
-lf 活用形のリストを印刷します。
-h ヘルプを印刷します。
-V 茶筅のバージョン番号を印刷します。
このマニュアルページは、Debian GNU / Linuxディストリビューション用に作成されました。
プログラムにはマニュアルページがありません。
onworks.netサービスを利用してオンラインで茶筅を使用する