英语法语西班牙语

Ad


OnWorks 网站图标

kakasi - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 kakasi

这是命令 kakasi,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


KAKASI - 汉字假名简单逆变器(在汉字之间,假名和罗马字之间)

概要


卡卡西 [选项] [jisyo1 [jisyo2 [jisyo1,,]]]

商品描述


卡卡西 在日语中,句子通常由汉字(汉字)混合而成,
假名(平假名和片假名)和罗马字(拉丁语音发音)。 这个节目
在这四种不同的日语书写方式之间转换。

这个程序对于那些终端或桌面不支持本机的人很有用
日语显示。 对于正在学习日语的人来说,这也是一个很好的工具
(国际学生和儿童等)。

一个词可以传入标准输入(stdin),然后被翻译并输出到
标准输出 (stdout)。 在下面的例子中,“bunchu”汉字被转换成
平假名。

kakasi -JH < 文档

自 2.3.0 版起,单词之间带有空格的文本已得到支持。 在里面
下面的示例输出在每个单词之间有空格。

kakasi -w < 文档

从 2.3.5 版本开始支持电平转换模式。 在下面的例子中,
简单的汉字不进行转换,困难的汉字被翻译成
平假名。

kakasi -l4 < 文档

卡卡西 可以将字母转换为字母字符。 还有片假名
JIS x0201 字符集中的字母和 JIS x0208 字符集中的平假名可以
相互转换。

卡卡西 以下括号中的字符集显示出来。

ASCII (a) 称为“ascii”字符集。

日式罗马 (j)
称为“jis roman”字符集。

图形 (g)
它是 DEC 图形字符集。

片假名 (k)
JIS x0201,定义为 GR 字符集的一部分。

为方便起见,JIS x0208 划分如下。

汉字 (J)
JIS x0208 字符包含在 16 到 94 个部分之间。

平假名 (H)
第 0208 部分(平假名)中包含的 JIS x4 字符

片假名 (K)
第 0208 部分(片假名)中包含的 JIS x5 字符

标志 (E)
JIS x0208 字符包含在第 1,2,3,6,7、8、XNUMX、XNUMX、XNUMX 和 XNUMX 节中。(注意第
9-15 在 JIS x0208 中未定义。)

可以在以下字符集之间进行翻译。

ASCII -> JISROMAN,符号

JISROMAN -> ASCII,符号

图形 -> ASCII、JISROMAN、符号

JISx0201 片假名
-> ASCII、JISROMAN、假名、平假名

符号 -> ASCII、JISROMAN

片假名 -> ASCII、JISROMAN、JISx0201 片假名、平假名

平假名 -> ASCII、JISROMAN、JISx0201 片假名、假名

汉字 -> ASCII、JISROMAN、JISx0201 片假名、假名、平假名

通过 ASCII 和 JISROMAN 的转换,完成了字母字符转换
来自 JISx0201 片假名、片假名、平假名和汉字。

示例:

1. 所有汉字都转换为平假名。

卡卡西-JH

2. 所有 JIS x0208 字符都转换为 JIS X 0201。

卡卡西 -Hk -Kk -Jk -Ea

3. 所有字符都转换为 JIS X 0208。

卡卡西 -aE -jE -gE -kK

4.所有字符都转为ascii,单词分开。

卡卡西 -Ha -Ka -Ja -Ea -ka

5.片假名和平假名字符的交换。

卡卡西 -HK -KH

转换 指定的 字符 设置


一些字符集按卡卡西分类,并用以下助记符表示:a、j、
g, k, E, H, K, J。

a --- ASCII 字符
j --- JIS ROMAN(几乎等于 ASCII,“~”和“
不同 ) 由 JIS x0201 定义
g --- DEC 图形字符
k --- JIS x0201 定义的片假名

E、H、K 和 J 包含在 JIS x0208 字符集中。

J --- JIS x0208 的汉字字符。
H --- JIS x0208 的 HIRAGANA 字符。
K --- JIS x0208 的片假名字符。
E --- 上述 JIS x0208 的其余字符,包括
字母、数字、符号等。

-(from)(to) 表示从字符集(from)到(to)的转换。 例如,-JK 选项
导致汉字字符转换为平假名。 下表中的组合为
可用的。 (你一定不要记住它,因为 -h 显示相同的信息)

到\从| ajk EHKJ g
-------+---------------------------------------- ——
一个| - o o1 o o1 o1 o12 o
j | o - o1 o o1 o1 o12 o
k | - 哦 o2
E | 哦 - 哦
哈 | 欧 - 欧2
克| 哦——

o - 转换。
1 -- 转换为罗马字。
2 -- 汉字 -> 假名转换。

汉子 编码 转换


不幸的是,日本使用了几种编码系统,并且改变了 JIS x0208 标准
1983年。因此,KAKASI可以自动区分编码系统和编码
如果文档不包含 JIS,则使用相同的输出编码系统
x0201 片假名。 如果包含 JIS x0201 KATAKANA 或您希望更改汉字编码
系统,您可以使用下一个选项。

-i : 输入编码
-o : 输出编码

jis -- 在互联网上广泛使用。 (例如:fj、jp、.. 新闻组)
源自 ISO-2022 编码方式。
newjis:由 ESC-$-B 调用的 JISx0208 (1983)。
oldjis:由 ESC-$-@ 调用的 JISx0208 (1978)。
euc,dec —— 常用于 UNIX 等计算机中。 JISx0208 是
分配给 GR(MSB 为 1)。 之间的主要区别
euc 和 dec 是 JISx0201 KATAKANA 和
DEC 图形字符。
sjis -- 由微软公司定义。广泛用于个人
计算机(MSDOS、Mac、..)
utf8——当前的国际标准。 所有现代操作系统都使用这个
Unicode 字符集的编码为默认值。

罗马吉 转换


汉字假名转换选项。 与 -J 一起使用? 选项。 罗马字书写有两种类型。
第一个是日本政府定义的Kunrei方法,第二个是
赫本法。 我认为赫本方法对外国人来说听起来很自然。

-rhepburn : 赫本法(默认)
-rkunrei : Kunrei方法

其他 配置


-p:列出所有可能的读数。 如果存在两个或更多
可能的读数,KAKASI 将它们显示在大括号 {aaa,bbb} 中。
-s:在单词之间插入一个单独的字符。
-f:假名模式。 通过阅读显示原始汉字。
-c:跳过单词中的字符。 (默认 TAB CR LF 空白)
-C:将罗马字大写(使用 -Ja 或 -Jj 选项)
-U:大写罗马字(使用 -Ja 或 -Jj 选项)
-u:调用 fflush()。
-w:wakatigaki 模式。 'wakatigaki' 是分词
日语句子。

字典


卡卡西 可以接受额外的字典到系统字典。 可接受的格式
额外的字典是 SKK 格式,和 格式等等。 也就是说,每条记录是
一行有两个字段,Yomi(阅读)和 Jukugo(成语)。 字段用
逗号(或 TAB,或空白)。 汉字代码仅限于 JIS 或 EUC。 看另一个
有关更多详细信息,请参阅名为 JISYO 的文档。

环境 变数


该行为受以下环境变量影响。

坎瓦迪克路径
指定 kanwadict 的路径(包括文件名的完整路径)。 默认值为
/usr/share/kakasi/kanwadict。

泰吉词典路径
指定 itaijidict 的路径(包括文件名的完整路径)。 默认值为
/usr/share/kakasi/itaijidict。

使用 onworks.net 服务在线使用 kakasi


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad