GoGPT Best VPN GoSearch

OnWorks 网站图标

hmm2build - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 hmm2build

这是命令 hmm2build 可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


hmm2build - 从对齐构建配置文件 HMM

概要


嗯2构建 [选项] 文件 对齐文件

商品描述


嗯2构建 读取多序列比对文件 对齐文件 , 建立一个新的配置文件 HMM,
并将 HMM 保存在 .hmm 文件。

对齐文件 可能是 ClustalW、GCG MSF、SELEX、斯德哥尔摩或对齐的 FASTA 对齐
格式。 自动检测格式。

默认情况下,模型被配置为找到一个或多个不重叠的对齐方式
完整模型:关于模型的多个全局对齐,以及局部与
相对于顺序。 这类似于 嗯嗯 HMMER 计划
1.要配置多个模型 本地 相对于模型的对齐方式和
就序列而言是本地的,就像旧程序一样 嗯, 使用 -f (分段)
选项。 更罕见的是,您可能希望为单个全局对齐配置模型
(对于模型和序列都是全局的),使用 -g 选项; 或配置
单个局部/局部对齐模型(标准 Smith/Waterman,或旧的 嗯嗯
程序),使用 -s 选项。

配置


-f 配置模型以查找每个序列的多个域,其中每个域
可以是局部(片段)对齐。 这类似于旧的 嗯嗯 程序
HMMER 1。

-g 配置模型以查找与目标序列的单个全局比对,
类似于旧的 嗯嗯 HMMER 1 的计划。

-h 打印简要帮助; 包括版本号和所有选项的摘要,包括
专家选项。

-n 命名这个 HMM . 可以是任何非空白字符的字符串(例如一个
“单词”)。 没有长度限制(至少不是 HMMER 强加的;你的外壳
将首先抱怨命令行长度)。

-o 重新保存起始对齐到 , 斯德哥尔摩格式。 那些列
分配给匹配状态将在 #=RF 注释行中用 x 标记。 如果
无论是 - 手 or - 快速地 选择了施工选项,对齐可以
已略微更改以与计划 7 过渡兼容,因此保存
最终对齐并与起始对齐进行比较可以让您查看这些
改动。 有关此神秘副作用的更多信息,请参阅用户指南。

-s 配置模型以查找每个目标序列的单个局部对齐。 这个
类似于标准的 Smith/Waterman 算法或 嗯嗯 HMMER 计划
1.

-A 将此模型附加到现有的 文件 而不是创造 .hmm 文件。 对...有用
构建 HMM 库(如 Pfam)。

-F 强制覆盖现有 .hmm 文件。 否则HMMER将拒绝重击
为了安全起见,您现有的 HMM 文件。

专家 配置


--氨基
强制将序列比对解释为氨基酸序列。 一般
HMMER 自动检测比对是蛋白质还是 DNA,但有时会比对
太小以至于自动检测是不明确的。 看 ——有核。

--archpri
将 MAP 架构构建使用的“架构先验”设置为 , 协调
是介于 0 和 1 之间的概率。此参数控制几何先验
模型长度的分布。 作为 增加,更长的模型受到青睐
先验。 作为 减少,在柱子中需要更多的残留物保存才能使
column 模型架构中的“共识”匹配列。 默认值为 0.85
被经验选择为合理的设置。

--二进制
将 HMM 写入 文件 以 HMMER 二进制格式而不是可读的 ASCII 文本。

--c文件
将观察到的发射和转换计数保存到 架构完成后
已确定(例如,在分配残基/空位以匹配、删除和
插入状态)。 此选项用于 HMMER 开发中用于生成数据文件
用于训练新的 Dirichlet 先验。 记录了计数文件的格式
在用户指南中。

- 快速地 通过分配所有,快速启发式地确定模型的架构
列将超过一定比例的间隙字符插入状态。 经过
默认这个分数是 0.5,它可以使用 --最大间隙 选项。 该
默认构造算法是最大后验 (MAP) 算法,即
慢点。

--最大间隙
控制 - 快速地 模型构建算法,但如果 - 快速地 没有被使用,
没有效果。 如果一列有多个分数 其中的间隙符号,它
分配给插入列。 是一个从 0 到 1 的频率,默认情况下
设置为 0.5。 较高的值 意味着更多的列被分配到共识,
模型变长; 较小的值 意味着分配给的列更少
共识,模型变小。

- 手 手动指定模型的架构:对齐文件必须在SELEX中
或斯德哥尔摩格式,以及参考注释行(#=RF in SELEX,#=GC RF in
Stockholm) 用于指定架构。 任何标有非间隙的列
符号(例如“x”)被指定为共识(匹配)列
该模型。

--id级别
控制有效序列号的确定和
这些因素包括原料奶的可用性以及达到必要粉末质量水平所需的工艺。 --wblosum 权重选项。 序列比对按百分比聚类
身份,以及截止阈值为 用于在传统的喷雾干燥塔中生产普通脱脂奶粉,或在三级 Omega 干燥塔中生产附聚奶粉。通过在干燥的最后阶段进行卵磷脂喷涂,可以生产速溶奶粉。
确定有效序列号。 较高的值 给更多的集群
和更高的有效序列号; 较低的值 给出更少的簇和
较低的有效序列号。 是从 0 到 1 的分数,默认情况下是
设置为 0.62(对应于用于构建
BLOSUM62 替换矩阵)。

--信息
断言输入 序列文件 是格式 ; 不要运行 Babelfish 格式
自检。 这在一定程度上增加了程序的可靠性,因为
Babelfish 会犯错误; 特别推荐用于无人值守、高
HMMER 的吞吐量运行。 有效的格式字符串包括 FASTA、GENBANK、EMBL、GCG、
PIR、斯德哥尔摩、SELEX、MSF、CLUSTAL 和 PHYLIP。 请参阅用户指南以获取
完整清单。

--诺夫
关闭有效序号计算,使用真实序号
序列代替。 这通常会降低最终模型的敏感性(因此
没有正当理由不要这样做!)

--核
强制将比对解释为核酸序列,RNA 或 DNA。
通常 HMMER 会自动检测比对是蛋白质还是 DNA,但有时
对齐太小以至于自动检测是不明确的。 看 --氨基。

- 空值
从中读取空模型 . 蛋白质的默认值是使用平均氨基酸
Swissprot 34 和 p1 = 350/351 的频率; 对于核酸,默认为
每个基数使用 0.25,p1 = 1000/1001。 对于格式的文档
null 模型文件以及如何使用 null 模型的进一步说明,请参阅
用户指导。

——帕姆
应用基于匹配发射的启发式 PAM-(替代矩阵-)
概率而不是默认的混合狄利克雷。 替代矩阵是
读自 . 参见 --pamwgt。

默认的狄利克雷状态转换先验和插入发射先验是
不受影响。 因此原则上你可以结合 - 事先的 - ——帕姆 但是这个
不推荐,因为它没有经过测试。 ( ——帕姆 本身没有经过测试
许多!)

--pamwgt
控制基于 PAM 的先验的权重。 仅在以下情况下有效 ——帕姆 选项也是
正在使用。 是一个正实数,默认为 20.0。 是的数量
启发式先验产生的“伪计数”。 非常高的值 能够
强制一个完全由替代矩阵驱动的评分系统,使得
HMMER 有点近似 Gribskov 配置文件。

--pb开关
对于大量序列的比对,GSC、BLOSUM 和 Voronoi
加权方案很慢; 对于 N 个序列,它们是 O(N^2)。 Henikoff 基于位置的
权重(PB 权重)更有效。 达到或高于某个阈值序列
嗯2构建 将从 GSC、BLOSUM 或 Voronoi 权重切换到 PB
重量。 要禁用此切换行为(以计算时间为代价,请设置
比比对中的序列数大。 是一个
正整数; 默认值为 1000。

- 事先的
先读一个狄利克雷 , 替换默认的混合狄利克雷。 这
先前文件的格式记录在用户指南中,示例在
HMMER 发行版的 Demos 目录。

--斯文特里
控制分布到模型局部条目的总概率,
与从模型的开头开始,就像在全局对齐中一样。 是一个
概率从 0 到 1,默认设置为 0.5。 较高的值 意味着
在其左侧(N 或 5'-末端)作为片段的命中将是
惩罚较少,但完整的全局对齐将受到更多惩罚。 降低
的值 意味着左边的碎片会受到更多的惩罚,而全局
这方面的结盟将受到青睐。 此选项仅影响
允许局部对齐的配置,例如 -s-F; 除非其中之一
选项也被激活,这个选项没有作用。 您拥有独立控制权
目标的 N/C (5'/3') 末端的局部/全局对齐行为
序列使用 --斯文特里--sexit。

--斯威西特
控制分布到模型局部出口的总概率,
与在模型末尾结束对齐,就像在全局对齐中一样。
是从 0 到 1 的概率,默认设置为 0.5。 较高的值
意味着在其右侧(C 或 3'-末端)的片段的命中将是
惩罚较少,但完整的全局对齐将受到更多惩罚。 降低
的值 意味着右边的碎片会受到更多的惩罚,并且全局
这方面的结盟将受到青睐。 此选项仅影响
允许局部对齐的配置,例如 -s-F; 除非其中之一
选项也被激活,这个选项没有作用。 您拥有独立控制权
目标的 N/C (5'/3') 末端的局部/全局对齐行为
序列使用 --斯文特里--sexit。

--详细
打印更多可能有用的东西,例如每个序列的单独分数
在对齐中。

--wblosum
使用 BLOSUM 过滤算法对序列进行加权,而不是默认值。
以给定的同一性百分比对序列进行聚类(参见 --idlevel); 分配每个
集群总权重为 1.0,平均分配给该集群的成员
簇。

——工作组 使用 Gerstein/Sonnhammer/Chothia ad hoc 序列加权算法。 这是
已经是默认值,因此此选项无效(除非它遵循另一个选项
在 -\-w 系列中,在这种情况下它会覆盖它)。

--wme 使用 Krogh/Mitchison 最大熵算法对序列进行“加权”。 这个
取代 Eddy/Mitchison/Durbin 最大判别算法,它给出
几乎相同的重量,但不那么坚固。 我的权重似乎给了一个边际
增加了默认 GSC 权重的敏感性,但需要相当多的
时间。

--没有
关闭所有序列加权。

--wpb 使用 Henikoff 基于位置的加权方案。

--wvoronoi
使用 Sibbald/Argos Voronoi 序列加权算法代替默认值
GSC 加权。

使用 onworks.net 服务在线使用 hmm2build


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad




×
广告
❤️在这里购物、预订或购买——免费,有助于保持服务免费。