这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令 proda,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
proda - 具有重复和重排的蛋白质序列的多重比对
概要
普达 [选项[文件] [> 产量]
商品描述
本手册页简要记录了 普达 命令。
普达 (Protein Domain Aligner) 是一个公共领域的软件,用于生成多个
具有重复和重排的蛋白质序列的比对,例如具有
多个域。
给定一组蛋白质序列作为输入,ProDA 首先找到局部成对比对
在所有序列对之间,然后形成可比对序列片段的块,和
最后生成块的多个对齐。 ProDA 依赖于使用的许多技术
in 问题 (<http://probcons.stanford.edu>),最近的多重矫正器,显示出高
在许多流行的基准测试中的准确性。
INPUT FORMAT
Proda 接受 MFA 格式的输入文件。 MFA 格式指定如下:
· MFA格式由多个序列组成;
· MFA 格式中的每个序列都以单行描述开头,然后是
序列数据行;
· 描述行通过大于号 (">") 与序列数据区分开来
第一列中的符号。
OUTPUT FORMAT
对于一组输入序列,Proda 通常依次输出几个块,每个块由
可比对序列片段。 每个块后跟它的多重对齐。
通过列出其序列片段来指定块。 每个片段输出为
sequence_name(start-end),其中 sequence_name 是原始序列的名称,并且
start 和 end 分别是片段开始和结束的位置。
Proda 以如下所述的 ClustalW (ALN) 格式生成块对齐:
· ClustalW 格式由一个单独的标题行和后面的序列数据组成
50 个对齐位置的块;
· 每个块包括:
· 比对中每个序列的一行数据——特别是
序列名称;
· 50个字符的对齐方式;
· 一条注释行表示完全保守 (*)、强保守 (:),或
弱保守列 (.);
· 描述行通过大于号 (">") 与序列数据区分开来
第一列中的符号。
FASTA 格式 HPMC胶囊 产量
如果指定了 -fasta 选项,那么除了常规输出之外,ProDA 还会生成一个
包含 FASTA 格式的块对齐的文件。 输出文件同名
第一个输入文件和扩展名“.fasta”。 两个连续的块对齐是
由包含字符“#”的行分隔。
FASTA 格式描述如下:
· FASTA 格式由输入文件中给出的所有序列组成;
· FASTA 格式中的每个序列都以单行描述开头,然后是
序列数据行;
· 描述行通过大于号 (">") 与序列数据区分开来
第一列中的符号;
·对齐的残基是大写的,未对齐的残基是小写的。
由于最终比对每个序列只包含一次,所以这个选项应该只使用
如果输入序列不包含重复。
配置
-L [最小长度]
设置最小对齐长度等于 [min_length]。
ProDA 查找长度大于或等于阈值 L 的对齐。
默认值,L = 30。此选项将阈值设置为 [min_length]。
-后
在计算局部成对对齐时使用后验解码。
ProDA 使用 pair-HMM 计算两个序列之间的局部成对比对
以及维特比解码或后验解码。 默认选项是使用
维特比解码比后验解码更快,但可能不太准确。
打开此选项会指示对齐器改用后解码。 在
在上面的示例中,输出是在打开 -posterior 选项的情况下生成的。
-无声
对齐时不要报告进度。
启用此选项会指示对准器在执行时不报告进度
对齐。 默认情况下,ProDA 报告所有成对对齐的进度,阻止
生成,以及块对齐。 由于算法的某些阶段,特别是
成对对齐,可能需要很长时间,报告进度让程序看起来
跑步时活着。
-tran
在形成可比对序列片段块时使用传递性。
如果两个序列片段是局部序列的一部分,则它们可以直接比对
成对对齐。 默认情况下,当且仅当两个片段被认为是可对齐的
如果它们可以直接对齐。 打开此选项会指示对准器
当两个片段可直接对齐或两者都可对齐时,则认为它们是可对齐的
它们可以直接与第三个片段对齐。
-法斯塔
除了 ClustalW 格式之外,还使用 FASTA 输出格式。
当此选项打开时,对齐器以 FASTA 格式生成输出
并存储在与第一个输入文件和扩展名相同的文件中
“.fasta”,除了标准输出的正常输出。 应该使用这个选项
仅当输入序列不包含重复时。
使用 onworks.net 服务在线使用 proda