这是命令 dialign2-2,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
dialign2-2 - 使用段到段方法的多重对齐程序
概要
对齐2-2 [选项] [seq_file]
序列文件 是输入序列文件的名称; 这必须是多个 FASTA 文件(所有
序列在一个文件中)。
商品描述
对齐2-2 是一个从类似片段的无间隙对构建比对的程序
的序列。 如果(可能)编码核酸序列要比对,DIALIGN
可选地将比较的“核酸片段”翻译成“肽片段”,根据
到遗传密码——不预先假定三个可能的阅读框架中的任何一个,所以
检查所有阅读框架组合是否具有显着相似性。
默认情况下,DIALIGN 创建一个包含
· DIALIGN 格式的输入序列的比对。
· FASTA 格式的相同对齐方式。
· PHYLIP 格式的序列树。 这棵树是通过应用 UPGMA 构建的
DIALIGN 相似度得分的聚类方法。 它大致反映了不同
序列之间的相似度。 对于详细的系统发育分析,我们
推荐系统发育重建的常用方法。
输出文件的格式记录在 /usr/share/doc/dialign/USER_GUIDE.gz。 该
可选择 FASTA、CLUSTALW 和 MSF 输出格式(请参阅选项)。
配置
- 亚足联
创建额外的输出文件“*.afc”,其中包含考虑的所有片段的数据
结盟。 警告:这个文件可能很大!
-afc_v
喜欢 ”- 亚足联" 但冗长:片段被显式打印。警告:这个文件可以是
更大!
-ANC
锚定对齐。 需要一个文件 序列文件.anc 包含锚点。
-CS
如果片段被翻译,不仅是“沃森链”,还有“克里克链”
被看着。
-CW
CLUSTAL W 格式的附加输出文件。
-ds
“DNA 对齐加速”。 考虑到非翻译的核酸片段
仅当它们以至少两场比赛开始时。 以牺牲为代价加快 DNA 对齐
的敏感性。
-F A
FASTA 格式的附加输出文件。
-ff
创建文件 *.frg 包含有关属于该部分的所有片段的信息
各自的最优成对对齐网络加上关于一致性的信息
多重对齐。
-fn 输出文件
输出文件被命名 输出文件.extension.
-fop
创建文件 *.fop 包含所有片段的坐标
各自的成对比对。
-fsm
创建文件 *.fsm 包含作为最终部分的所有片段的坐标
对准
-iw
重叠权重关闭(默认情况下,如果重叠权重达到 35
序列对齐)。 此选项可加快对齐速度,但可能会导致减少
对齐质量。
-lgs
“长基因组序列” - 结合了以下选项: -嘛, -thr 2, -l最大 30,
-最小值 8, -nta, -ff, -fop, -ff, -CS, -ds, -太平洋标准时间.
-lgs_t
喜欢 ”-lgs" 但在肽水平评估所有片段对(而不是
“混合对齐”与“-lgs”选项一样)。 因此比 -lgs 快但不是很快
对非编码区敏感。
-l最大 x
最大片段长度 = x (默认: x = 40或 x = 120 对于“翻译的”片段)。
短 x 加速程序,但可能会影响对齐质量。
它
(长输出)附加文件 *。日志 与信息相邻的片段选择用于
成对对齐和关于多对齐过程中的一致性。
-嘛
“混合比对”由 P 片段和 N 片段组成,如果核酸序列
对齐。
-面具
不属于所选片段的残基在输出中被替换为“*”字符
对齐(而不是用小写字符打印)
-垫
创建文件 *垫 具有来自已被替换的片段的替换计数
选择对齐。
-mat_thr t
像“-mat”,但只有具有权重分数的片段 > t 被考虑。
-最大链接
“最大链接”聚类用于构建序列树(而不是 UPGMA)。
-最小链接
使用“最小链接”聚类。
-莫特
“主题”选项。
-MSF
MSF 格式的单独输出文件。
-n
输入序列是核酸序列。 没有片段的翻译。
-nt
输入序列是核酸序列,翻译“核酸片段”
到“肽段”。
-nta
“无文本对齐”。 文本对齐被抑制。 如果其他
输出文件是感兴趣的——例如创建的片段文件 -ff, -fop, -fsm or
它.
-o
快速版本,产生的对齐方式可能略有不同。
-流
强制重叠权重(默认情况下,重叠权重仅在达到 35
序列对齐,因为计算重叠权重很耗时)。 警告:
重叠权重通常会提高对齐质量,但运行时间会增加
顺序 O(n^4) 与序列数。 这就是默认情况下重叠的原因
权重仅用于<36 个序列的序列集。
-太平洋标准时间
“打印状态”。 创建和更新文件 *.sta 与有关当前的信息
程序运行的状态。 如果对齐大数据集,建议使用此选项
因为它允许用户估计剩余的运行时间。
-最小值 x
片段中第一个残基对(或密码子对)的最小相似度值。 速度
上蛋白质比对或翻译的 DNA 片段比对,代价是
灵敏度。
星 x
表示局部相似程度的“*”字符的最大数量
序列。 默认情况下,不使用星号,而是使用 0 到 9 之间的数字。
-stdo
结果写入标准输出。
- 那
标准文本对齐打印(覆盖文本对齐的抑制
特殊选项,例如 -lgs)。
-thr x
阈值 T = x。
-xfr
“排除片段”。 可以指定不考虑的片段列表
成对对齐。
一般备注:如果使用了相互矛盾的选项,则后续选项会覆盖之前的选项
那些,例如: dialign2-2 -nt -n 序列文件 使用“-n”选项运行程序(没有
翻译!),而 dialign2-2 -n -nt 序列文件 使用“-nt”选项运行它
(翻译!)。
使用 onworks.net 服务在线使用 dialign2-2