langidentp - 云端在线

这是 langidentp 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


langident - 标识写入的语言文件

概要


langident [选项] 文件 1 [文件 2 ...]

商品描述


标识使用 Perl 模块 Lingua::Identify 编写的语言文件。

配置
-a
显示所有结果(不仅仅是最可能的语言)。

-c
显示最可能语言的置信度(它将是紧随其后的第一个值
最可能的语言)。

-d
调试(仅限开发)。

-E 编码
选择输入编码。 默认为 UTF-8。

# 使用 ISO-8859-1 (latin1)
langident -E ISO-8859-1 文件

-e 方法
选择要使用的方法。 有三种方法可以做到这一点:

# 简单地使用一个方法
langident -e ngrams3 文件

# 使用几种方法(用逗号分隔它们)
langident -e 前缀3,后缀3

# 使用多种方法并为每个方法分配不同的权重
langident -e 小字=2,前缀=1,ngrams3=1.3

可用的方法如下: 小词, 前缀1, 前缀2, 前缀3,
前缀4, 后缀1, 后缀2, 后缀3, 后缀4, ngrams1, ngrams2, ngrams3
ngrams4.

-h
显示帮助信息并退出。

-l
列出所有可用的语言并退出。

-m NUMBER
设置要显示的最大结果数(语言)(显示 N 个最可能的语言,
按概率降序排列)。

覆盖 -a 开关。

-o 语言
仅适用于指定的语言。

# 仅识别葡萄牙语和英语
langident -o pt,en *

-p
还显示百分比。

-s 尺寸
要检查的最大尺寸。

-v
显示版本并退出。

示例


使用方法 ngrams2 和 ngrams1,将重要性的两倍分配给 ngrams2 (-e
转变); 输出将包括三种最可能的语言(-m 开关)及其
第一个结果的百分比(-p 开关)以及置信度(-c 开关)。

$ langident -e ngrams2=2,ngrams1 -c -p -m 3 自述文件
自述文件:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$

TO DO


· 添加一个开关来忽略 HTML 标签(也可能是其他格式)

使用 onworks.net 服务在线使用 langidentp



最新的 Linux 和 Windows 在线程序