英语法语西班牙语

Ad


OnWorks 网站图标

langidentp - 云端在线

在 OnWorks 免费托管服务提供商中通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器运行 langidentp

这是 langidentp 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


langident - 标识写入的语言文件

概要


langident [选项] 文件 1 [文件 2 ...]

商品描述


标识使用 Perl 模块 Lingua::Identify 编写的语言文件。

配置
-a
显示所有结果(不仅仅是最可能的语言)。

-c
显示最可能语言的置信度(它将是紧随其后的第一个值
最可能的语言)。

-d
调试(仅限开发)。

-E 编码
选择输入编码。 默认为 UTF-8。

# 使用 ISO-8859-1 (latin1)
langident -E ISO-8859-1 文件

-e 方法
选择要使用的方法。 有三种方法可以做到这一点:

# 简单地使用一个方法
langident -e ngrams3 文件

# 使用几种方法(用逗号分隔它们)
langident -e 前缀3,后缀3

# 使用多种方法并为每个方法分配不同的权重
langident -e 小字=2,前缀=1,ngrams3=1.3

可用的方法如下: 小词, 前缀1, 前缀2, 前缀3,
前缀4, 后缀1, 后缀2, 后缀3, 后缀4, ngrams1, ngrams2, ngrams3
ngrams4.

-h
显示帮助信息并退出。

-l
列出所有可用的语言并退出。

-m NUMBER
设置要显示的最大结果数(语言)(显示 N 个最可能的语言,
按概率降序排列)。

覆盖 -a 开关。

-o 语言
仅适用于指定的语言。

# 仅识别葡萄牙语和英语
langident -o pt,en *

-p
还显示百分比。

-s 尺寸
要检查的最大尺寸。

-v
显示版本并退出。

示例


使用方法 ngrams2 和 ngrams1,将重要性的两倍分配给 ngrams2 (-e
转变); 输出将包括三种最可能的语言(-m 开关)及其
第一个结果的百分比(-p 开关)以及置信度(-c 开关)。

$ langident -e ngrams2=2,ngrams1 -c -p -m 3 自述文件
自述文件:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$

TO DO


· 添加一个开关来忽略 HTML 标签(也可能是其他格式)

使用 onworks.net 服务在线使用 langidentp


免费服务器和工作站

下载 Windows 和 Linux 应用程序

  • 1
    移相器
    移相器
    Phaser 是一个快速、免费且有趣的开放式
    源 HTML5 游戏框架,提供
    WebGL 和 Canvas 渲染
    桌面和移动网络浏览器。 游戏
    可以共...
    下载移相器
  • 2
    附庸引擎
    附庸引擎
    VASSAL 是一个游戏引擎,用于创建
    电子版传统板
    和纸牌游戏。 它提供支持
    游戏块渲染和交互,
    和...
    下载 VASSAL 引擎
  • 3
    OpenPDF - iText 的分支
    OpenPDF - iText 的分支
    OpenPDF 是一个 Java 库,用于创建
    以及使用 LGPL 编辑 PDF 文件和
    MPL 开源许可证。 OpenPDF 是
    iText 的 LGPL/MPL 开源继承者,
    一个...
    下载 OpenPDF - iText 的分支
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - 自动化系统
    地球科学分析 - 是地理
    信息系统 (GIS) 软件
    地理数据的强大功能
    加工和分析...
    下载 SAGA GIS
  • 5
    Java/JTOpen 工具箱
    Java/JTOpen 工具箱
    IBM Toolbox for Java / JTOpen 是一个
    Java类库支持
    客户端/服务器和互联网编程
    模型到运行 OS/400 的系统,
    i5/OS, 哦...
    下载 Java/JTOpen 工具箱
  • 6
    D3.js
    D3.js
    D3.js(或数据驱动文档的 D3)
    是一个 JavaScript 库,它允许你
    生成动态的交互式数据
    Web 浏览器中的可视化。 与D3
    您...
    下载 D3.js
  • 更多 ”

Linux 命令

Ad