这是 lt-proc 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
lt-proc - 此应用程序是词法处理模块和工具的一部分( 工具箱
)
这个工具是 apertium 机器翻译架构的一部分:
http://www.apertium.org.
概要
进程 [ -a | -b | -o | -c | -d | -e | -g | -n | -p | -s | -t | -v | -h -z -w ] fst_文件
[输入文件 [输出文件]]
进程 [ - 分析 | - 双语 | --冲浪双语 | - 区分大小写 | --调试生成
| --分解名词 | - 一代 | --非标记代 | --标记生成 | --后代 |
--骚 | --音译 | --空刷新 --字典案例 --分解化合物 |
- 版 | - 帮帮我 ] fst_file [输入文件 [输出文件]]
商品描述
进程 是负责提供四个词法处理的应用程序
功能
· 形态 分析仪 ( 选项 -a )
· 词法 转让 ( 选项 -n )
· 形态 发电机 ( 选项 -g )
· 后发电机 ( 选项 -p )
它通过读取包含紧凑高效的二进制文件来完成这些任务
字典的表示(一类称为增广的有限状态转换器
字母转换器)。 这些文件是由 LT-comp(1).
值得一提的是,有些字符(`[',`]',`$',`^',`/',`+') 是 特别
用于格式化和封装的字符。 如果必须使用它们,它们应该被转义
从字面上看,例如:`['...`]' 被忽略并且 a 的格式 换行 是`^...$'.
配置
-一种, - 分析
以表面形式标记文本(出现在文本中的词汇单位)和
为每个表面形式提供一个或多个由引理组成的词汇形式,
词汇类别和形态变化信息。 标记化不是
一方面由于收缩的存在而直接,另一方面
另一方面,多词词汇单位。 对于收缩,系统读入一个
单一表面形式并提供相应的词汇形式序列。
多词表面形式以从左到右、最长匹配的方式进行分析。
多词表层形式可能是不变的(例如多词介词或
连词)或屈折(例如,在 es, "echaban de 美诺斯”, "他们错过了",
是动词不完全指示时态的一种形式 "echar de 美诺斯”, “到
小姐”)。对某些类型的不连续多字单元的有限支持也是
可用的。 单字表面形式分析产生的输出如下
例子: “康塔” ->`^康塔尔/康塔尔$' 或`“达巴” ->
`^daba/dar /达尔$'.
-b, - 双语
是否进行词汇转移,附加未指定的形态符号队列
在字典中。 作为分析模式,支持多种词法形式
源语言中给定词汇形式的目标语言。 正常工作
与 apertium-pretransfer 的输出。
-o, --冲浪双语
与 -b 一样,但从 apertium-tagger -p 获取输入,具有表面形式,如果
双语词典中找不到词法形式,它输出表面
词的形式。
-C, - 区分大小写
使用传入字符的字面大小写
-d, --调试生成
变形。 拥有所有东西的一代
-e, --分解化合物
尽量把生词当成复合词,分解。
-w, --字典案例
使用词典中包含的案例信息,而不是表面案例
(仅适用于分析模式)。
-G, - 一代
为每个目标语言词汇形式提供一个目标语言表面形式,通过
适当地变形它。
-n, --非标记代
形态生成(如 -g) 但没有未知的文字标记(星号“*”)。
-b, --标记生成
形态生成(如 -g) 但保留词性标签。
-p, --后代
执行正字法运算,例如收缩和撇号。 这
后发电机通常是 αδρανές (只是将输入复制到输出)直到
特别 报警 包含在某些目标语言表面形式中的符号 唤醒 它高达
如有必要,执行特定的字符串转换; 然后它回到
睡觉。
-是的, --骚
输入处理在 正音 (以前`圣') 注释系统格式:
http://orthoepikon.sf.net.
-t, --音译
应用音译词典
-z --空刷新
在空字符上刷新输出
-v, - 版
显示版本号。
-H, - 帮帮我
显示此帮助。
使用 onworks.net 服务在线使用 lt-proc