这是命令 pocketsphinx_batch 可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
pocketsphinx_batch - 以批处理模式运行语音识别
概要
Pocketsphinx_batch -唔 目录 -字典 字典文件 [ 选项 ] ...
商品描述
以批处理模式对话语列表运行语音识别。 参数列表
如下:
-地址
音频文件头的大小(以字节为单位)(头被忽略)
-adcin 输入是原始音频数据
-agc c0 的自动增益控制('max'、'emax'、'noise' 或 'none')
-agctresh
自动增益控制的初始阈值
-全手机
使用语音 lm 进行音素解码
-allphone_ci
仅使用语音 lm 和上下文无关单元执行音素解码
-α 预加重参数
-arg文件
提供额外参数的文件。
-规模
用于计算置信度分数的声学模型量表的倒数
-aw 应用于声学分数的反向权重。
-回溯
将结果和回溯打印到日志文件。
-光束 波束宽度应用于维特比搜索中的每一帧(值越小意味着越宽
光束)
-最佳路径
在词格上运行 bestpath (Dijkstra) 搜索(第三遍)
-最佳路径lw
最佳路径搜索的语言模型概率权重
-build_outdirs
在输出目录中创建缺少的子目录
-cepdir
文件目录(以控制文件中的文件规范为前缀)
-cepext
输入文件扩展名(控制文件中文件规范的后缀)
-ceplen
输入特征向量中的分量数
-cmn 倒谱均值归一化方案(“当前”、“先前”或“无”)
-cminit
使用 'prior' 时倒谱均值的初始值(逗号分隔)
-康帕尔森
计算每一帧中的所有senone分数(当有很多时可以更快
塞诺斯)
-控制 列出要处理的话语的文件
-控制计数
要处理的话语数(跳过后 -ctl偏移量 条目)
-ctlincr
执行控制文件中的每第 N 行
-ctl偏移量
开头的话语数 -控制 要跳过的文件
-澳门电信 以 CTM 文件格式输出(可能需要后排序)
-调试 调试消息的级别
-字典 发音词典(词典)输入文件
-dictcase
字典区分大小写(注意:不区分大小写适用于 ASCII 字符
只有)
-抖动
添加 1/2 位噪声
-双体重
使用双带宽滤波器(相同的中心频率)
-ds 帧 GMM 计算下采样率
-fdict 单词发音词典输入文件
-壮举 特征流类型,取决于声学模型
-featparams
包含特征提取参数。
-填充概率
填充词转移概率
-弗拉特 帧速率
-fsg 格式化有限状态语法文件
-fsgctl
文件列表 FSG 文件用于每个话语
-fsgdir
FSG 文件的目录
-fsgext
FSG 文件的扩展名(包括前导点)
-fsgusealtpron
向 FSG 添加替代发音
-fsgusefiller
在每个状态插入填充词。
-fwdflat
在词格上运行向前平面词典搜索(第二遍)
-前向平梁
波束宽度应用于第二遍平面搜索中的每一帧
-fwdflatefwid
fwdflat 搜索中要搜索的单词的最小结束帧数
-fwdflatlw
平面词典(第二遍)解码的语言模型概率权重
-fwdflatsfwin
格子中的帧窗口,用于在 fwdflat 搜索中搜索后继词
-fwdflatwbeam
在第二遍平面搜索中应用于词出口的波束宽度
-fwdtree
向前运行词典树搜索(第一遍)
-唔 包含声学模型文件。
-炒作 输出文件名
-hypseg
带有分割文件名的输出
-输入端
输入数据的字节序,无论大小,如果是 NIST 或 MS Wav,则忽略
-jsgf 语法文件
-关键词
现货
-kws 包含要识别的关键短语的文件,每行一个
-kws_延迟
延迟等待最佳检测分数
-kws_plp
关键字发现的电话循环概率
-kws_阈值
p(hyp)/p(alternatives) 比率的阈值
-latsize
初始反向指针表大小
-lda 包含要应用于特征的变换矩阵(单流特征
只有)
-拉达丁
特征变换输出的维度(0 表示使用整个矩阵)
-升降机
提升的正弦曲线的长度,或不提升的 0。
-lm 三元语言模型输入文件
-lmctl 一组语言模型
- -唔 和 -字典 始终需要参数。 任何一个 -lm or -fsg 是必须的,
取决于您使用的是统计语言模型还是有限状态语法。
要进行批处理模式识别,您需要指定一个控制文件,使用 -控制 这是一个
每行包含一个条目的简单文本文件。 每个条目都是输入文件的名称
相对于 -cepdir 目录,并且没有文件扩展名(在
这些因素包括原料奶的可用性以及达到必要粉末质量水平所需的工艺。 -cepext 争论)。
如果您使用声学特征文件作为输入(请参阅 狮身人面像_fe(1) 有关如何的信息
要生成这些),您还可以使用以下格式指定文件的子部分:
文件名 起始帧 端框 话语ID
使用onworks.net 服务在线使用pocketsphinx_batch