英語フランス語スペイン語

Ad


OnWorksファビコン

カカシ-クラウドのオンライン

Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、またはMACOSオンラインエミュレーターを介してOnWorks無料ホスティングプロバイダーでkakasiを実行します

これは、Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、MACOSオンラインエミュレーターなどの複数の無料オンラインワークステーションのXNUMXつを使用してOnWorks無料ホスティングプロバイダーで実行できるコマンドkakasiです。

プログラム:

NAME


KAKASI-漢字かなシンプルインバーター(漢字間、かなとローマ字の両方)

SYNOPSIS


カカシ [オプション] [じしょう1] [じしょう2] [jisyo 1 ,、]]]]

DESCRIPTION


カカシ 日本語の文章では、多くの場合、漢字(漢字)の混合物で構成されています。
かな(ひらがなとカタカナ)とローマ字(ラテン語の発音)。 このプログラム
これらのXNUMXつの異なる日本語の書き方を変換します。

このプログラムは、端末またはデスクトップがネイティブをサポートしていない人に役立ちます
日本語の表示。 また、これは日本語を学んでいる人にとって素晴らしいツールです
(留学生や子供など)。

単語を標準入力(stdin)に渡してから、次のように変換して出力することができます。
標準出力(stdout)。 次の例では、「文中」漢字は次のように変換されます。
ひらがな。

カカシ-JH <ドキュメント

バージョン2.3.0以降、単語の間にスペースを含むテキストがサポートされています。 の中に
次の例では、出力の各単語の間にスペースがあります。

カカシ-w <ドキュメント

バージョン2.3.5以降、レベル変換モードがサポートされています。 次の例では、
単純な漢字は変換されずに残され、難しい漢字は
ひらがな。

カカシ-l4 <ドキュメント

カカシ 文字を英字に変換することが可能です。 またカタカナ
JISx0201文字セットの文字とJISx0208文字セットのひらがなは
お互いの間で変換されます。

カカシ 表示される括弧内の次の文字セット。

ASCII(a)「ascii」文字セットとして知られています。

JISROMAN(j)
「jisroman」文字セットとして知られています。

グラフィック(g)
DECグラフィック文字セットです。

カタカナ(k)
GR文字セットの一部として定義されたJISx0201。

便宜上、JISx0208は以下のように分割されています。

漢字(J)
0208〜16セクションにJISx94文字が含まれています。

ひらがな(H)
セクション0208に含まれるJISx4文字(ひらがな)

カタカナ(K)
セクション0208に含まれるJISx5文字(カタカナ)

サイン(E)
セクション0208、1,2,3,6,7、8、XNUMX、XNUMX、およびXNUMXに含まれるJIS xXNUMX文字(このセクションに注意してください)
9-15はJISx0208では定義されていません。)

以下の文字セット間の翻訳が可能です。

ASCII-> JISROMAN、記号

JISROMAN-> ASCII、記号

グラフィック-> ASCII、JISROMAN、記号

JISx0201カタカナ
-> ASCII、JISROMAN、かな、ひらがな

サイン-> ASCII、JISROMAN

カタカナ-> ASCII、JISROMAN、JISx0201カタカナ、ひらがな

ひらがな-> ASCII、JISROMAN、JISx0201カタカナ、かな

漢字-> ASCII、JISROMAN、JISx0201カタカナ、カナ、ひらがな

ASCIIとJISROMANの変換により、英字変換が行われます。
JISx0201カタカナ、カタカナ、ひらがな、漢字から。

例:

1.漢字はすべてひらがなに変換されます。

カカシ-JH

2.すべてのJISx0208文字はJISX0201に変換されます。

カカシ-Hk-Kk -Jk -Ea

3.すべての文字がJISX0208に変換されます。

カカシ-aE-jE -gE -kK

4.すべての文字がASCIIに変換され、単語が分離されます。

カカシ-Ha-Ka -Ja -Ea -ka

5.カタカナとひらがなの文字を交換します。

カカシ-HK-KH

変換 専用 キャラクター セット


一部の文字セットはカカシによって分類され、次のニーモニックで示されます:a、j、
g、k、E、H、K、J。

a --- ASCII文字
j --- JIS ROMAN(ASCII、「〜」、「
異なる)JISx0201で定義
g --- DECグラフィック文字
k --- JISx0201で定義されたカタカナ

E、H、K、およびJは、JISx0208文字セットに含まれています。

J --- JISx0208の漢字。
H --- JISx0208のひらがな文字。
K --- JISx0208のカタカナ文字。
E --- JISx0208の上記の文字の残りの部分。
アルファベット、数字、記号など。

-(from)(to)は、文字セット(from)から(to)への変換を意味します。 たとえば、-JKオプション
漢字がひらがなに変換されます。 次の表の組み合わせは次のとおりです。
利用可能。 (-hは同じ情報を表示するため、覚えてはいけません)

to \ from | ajk EHKJ g
------- + ------------------------------------------ -
a | --o o1 o o1 o1 o12 o
j | o --o1 o o1 o1 o12 o
k | --oo o2
E | oo-o
H | o --o o2
K | oo-

o-変換されました。
1-ローマ字に変換されます。
2-漢字->かな変換。

漢字 コーディング 変換


残念ながら、日本ではいくつかのコーディングシステムが使用されており、JISx0208規格が変更されています
したがって、カカシはコーディングシステムとコーディングを自動的に区別することができます
改訂し、ドキュメントにJISが含まれていない場合は、同じ出力コーディングシステムを使用します
x0201カタカナ。 JIS x0201カタカナが含まれている場合、または漢字コーディングを変更したい場合
システムでは、次のオプションを使用できます。

-i:入力コーディング
-o:出力コーディング

jis-インターネットで広く使用されています。 (例:fj、jp、..ニュースグループ)
ISO-2022コーディング方法から派生。
newjis:ESC-$-Bによって呼び出されたJISx0208(1983)。
oldjis:ESC-$-@によって呼び出されたJISx0208(1978)。
euc、dec-コンピュータのようなUNIXでよく使用されます。 JISx0208は
GRに割り当てられます(MSBは1です)。 の主な違い
eucとdecはJISx0201カタカナと
DECのグラフィック文字。
sjis-MicrosoftCorpによって定義されています。個人で広く使用されています
コンピュータ(MSDOS、Mac、..)
utf8--現在の国際標準。 最近のすべてのOSはこれを使用します
デフォルトとしてのUnicode文字セットのエンコーディング。

ローマ字 変換


漢字かな変換オプション。 -Jと一緒に使用しますか? オプション。 ローマ字は2種類あります。
XNUMXつは日本政府によって定義されたKunreiメソッドであり、XNUMXつ目は
ヘップバーン法。 ヘップバーン法は外国人には自然に聞こえると思います。

-rhepburn:Hepburnメソッド(デフォルト)
-rkunrei:Kunreiメソッド

その他 OPTIONS


-p:すべての可能な読み取り値を一覧表示します。 XNUMXつ以上存在する場合
可能な読み取り値、KAKASIは中括弧{aaa、bbb}でそれらを示します。
-s:単語の間に別の文字を挿入します。
-f:ふりがなモード。 元の漢字を読みながら表示します。
-c:単語内の文字をスキップします。 (デフォルトのTAB CR LF BLANK)
-C:ローマ字の単語を大文字にします(-Jaまたは-Jjオプションを使用)
-U:大文字のローマ字(-Jaまたは-Jjオプション付き)
-u:fflush()を呼び出します。
-w:わかち書きモード。 「わかち書き」は、
日本語の文章。

辞書


カカシ システムディクショナリに追加のディクショナリを受け入れることができます。 許容できる形式
追加辞書の SKK フォーマット、および うーん フォーマットなど。 つまり、各レコードは
ヨミ(読書)と熟語(イディオム)のXNUMXつのフィールドを持つXNUMX行。 フィールドはで区切られます
カンマ(またはTAB、または空白)。 漢字コードはJISまたはEUCに制限されています。 別のを見る
詳細については、JISYOという名前のドキュメントを参照してください。

ENVIRONMENT 変数


動作は、次の環境変数の影響を受けます。

カンワディクトパス
kanwadictのパス(ファイル名を含むフルパス)を指定します。 デフォルト値は
/ usr / share / kakasi / kanwadict。

ITAIIDICTPATH
itaijidictのパス(ファイル名を含むフルパス)を指定します。 デフォルト値は
/ usr / share / kakasi / itaijidict。

onworks.netサービスを使用してオンラインでカカシを使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

Linuxコマンド

Ad