英語フランス語スペイン語

Ad


OnWorksファビコン

langidentp - クラウドでオンライン

Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーター上の OnWorks 無料ホスティング プロバイダーで langidentp を実行します。

これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの 1 つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド langidentp です。

プログラム:

NAME


langident - 言語ファイルが記述されている言語を識別します。

SYNOPSIS


langident [オプション] file1 [file2 ...]

DESCRIPTION


Perl モジュール Lingua::Identify を使用して記述された言語ファイルを識別します。

OPTIONS
-a
すべての結果を表示します (最も可能性の高い言語だけでなく)。

-c
最も可能性の高い言語の信頼レベルを表示します (これは、直後の最初の値になります)
最も可能性の高い言語)。

-d
デバッグ (開発のみ)。

-E エンコーディング
入力エンコーディングを選択します。デフォルトは UTF-8 です。

# ISO-8859-1 (latin1) を使用します
langident -E ISO-8859-1 ファイル

-e 方法
使用する方法を選択します。これを行うには 3 つの方法があります。

# 単純にメソッドを使用する
langident -e ngrams3 ファイル

# 複数のメソッドを使用します (カンマで区切ります)
langident -e 接頭辞 3、接尾辞 3

# いくつかのメソッドを使用し、それぞれに異なる重みを割り当てます
langident -e smallwords=2、prefixes=1、ngrams3=1.3

利用可能な方法は次のとおりです。 俗語, プレフィックス1, プレフィックス2, プレフィックス3,
プレフィックス4, 接尾辞1, 接尾辞2, 接尾辞3, 接尾辞4, ngrams1, ngrams2, ngrams3 &
ngrams4.

-h
ヘルプメッセージを表示して終了します。

-l
利用可能な言語をすべてリストして終了します。

-m
表示する結果 (言語) の最大数を設定します (最も可能性の高い N 個の言語を表示します)
確率の降順で)。

-a スイッチをオーバーライドします。

-o LANGUAGES
指定された言語でのみ動作します。

# ポルトガル語と英語のみを識別します
langident -o pt,en *

-p
パーセンテージも表示します。

-s サイズ
調査する最大サイズ。

-v
バージョンを表示して終了します。


メソッド ngrams2 と ngrams1 を使用し、2 倍の重要度を ngramsXNUMX に割り当てます (-e
スイッチ);出力には、最も可能性の高い 3 つの言語 (-m スイッチ) が含まれます。
最初の結果のパーセンテージ (-p スイッチ) と信頼水準 (-c スイッチ) も表示されます。

$ langident -engrams2=2,ngrams1 -c -p -m 3 README
README:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$

DO


· HTML タグ (おそらく他の形式も) を無視するスイッチを追加します。

onworks.net サービスを使用してオンラインで langidentp を使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

Linuxコマンド

Ad