这是命令 make-lingua-identify-languagep 可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
make-lingua-identify-language - 为 Lingua::Identify 创建语言模块
概要
make-lingua-identify-language 语言-标记语言-名称 file1 [file2 ...]
or
make-lingua-identify-语言 -d TAG1-LANGUAGE1/ [TAG2-LANGUAGE2/ ...]
or
使语言识别
商品描述
创建由 Lingua::Identify 使用的语言模块。
创建模块后,您仍然需要安装它们。
请注意,此脚本仍处于早期阶段。 请不要看
码...
没有参数,make-lingua-identify-language 假定模式 -d 并通过所有
当前目录中的目录。 这对于在您所在的目录中使用很有用
这样的事情:
.
|-- 英文
| `-- 英文.txt
|-- 法语-法语
| `--法语1.txt
| `--法语2.txt
`-- pt-葡萄牙语
`--葡萄牙语.txt
配置
-d
目录模式。 传递的每个参数都应该是一个目录,其名称必须采用以下形式
标签名(例如, en-english/ )。 传递的每个目录都应包含文本文件
可用于训练 Lingua::Identify。
-D
调试模式。 只为发展。
-h
显示帮助并退出。
-v
显示版本并退出。
-冗长
详细模式。
-locale=" ”
设置特定的语言环境。 这样,您的文本将在分析之前全部小写。
元文件
“META.yml”文件不会被解析为其他文件,它们会被忽略。
在目录模式下(“-d”开关),检查“META.yml”文件的语言代码信息
和套。
这是一个简单的“META.yml”供您放入目录中:
双字母代码:pt
三字母代码:por
设置:
葡萄牙语口语
这样,语言将被识别为两个字母的代码“pt”或三个
字母代码“por”; 它也将出现在集合 ":spoken_in_portugal" 中。
贡献 与 新品 语言
请不要使用您自己制作的模块做出贡献。 更容易做出贡献
未处理的文本,因为这允许新版本的 Lingua::Identify 不必
删除语言,以防到那时我无法与您联系。
使用 VHDL 语言编写 制作语言识别语言 创建一个新模块供您个人使用,如果您
必须,但尝试使用未处理的文本而不是那些模块做出贡献。
使用 onworks.net 服务在线使用 make-lingua-identify-languagep