这是 alimask 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
alimask - 将掩码线添加到多序列比对中
概要
阿里面具 [选项]
商品描述
阿里面具 用于将掩码线应用于多序列比对,基于提供的
对齐或模型坐标。什么时候 构建 接收掩码对齐作为输入,它
生成一个轮廓模型,其中设置了屏蔽位置的发射概率
匹配背景频率,而不是根据观察到的频率进行设置
对齐。特定位置的插入和删除率不会改变,即使在
屏蔽区域。 阿里面具 自动检测输入格式,并生成掩码对齐
斯德哥尔摩格式。 可能仅包含一个序列比对。
在对齐中屏蔽某个区域的一个常见动机是该区域包含
据观察,简单的串联重复会导致假阳性率高得令人无法接受
命中。
在最简单的情况下,掩码范围以相对于输入的坐标给出
对齐,使用 --alirange . 但更常见的情况是,该地区
masked 已在相对于轮廓模型的坐标中被识别(例如,基于
识别错误命中对齐或 HMM 徽标中的简单重复模式)。不是全部
对齐列将转换为配置文件中的匹配状态位置(请参阅 --symfrac
标志为 构建 供讨论),因此模型位置不一定匹配
对齐列位置。消除将模型位置转换为
对齐位置, 阿里面具 也接受模型坐标中的掩模范围输入,
运用 --型号范围 . 当使用这个标志时, 阿里面具 决定哪个对齐方式
职位将由 构建 作为匹配状态,一个过程需要
所有 构建 影响该决定的标志被提供给 阿里面具。正是因为这个原因
这么多 构建 标志也被使用 阿里面具.
配置
-h 帮助; 打印命令行用法和所有可用选项的简短提醒。
-o 将摘要输出定向到文件 , 而不是 标准输出.
配置 用于 指定 MASK RANGE
单个掩码范围以破折号分隔的对的形式给出,例如 --型号范围 10-20 和
多个范围可以作为逗号分隔列表提交, --型号范围 10-20,30-42.
--型号范围
提供模型坐标中的给定范围。
--alirange
在对齐坐标中提供给定范围。
--附加掩码
添加到通过对齐找到的现有蒙版。默认是覆盖任何
现有的面具。
--model2ali
只需打印模型范围,而不是实际生成屏蔽对齐
对应于输入对齐范围。
--ali2model
只需打印对齐范围,而不是实际生成屏蔽对齐
对应于输入模型范围。
配置 用于 指定 “
默认情况下,通过查看字母表类型(氨基、DNA 或 RNA)自动检测
的组成 文件. 自动检测通常非常可靠,但偶尔
字母类型可能不明确,自动检测可能会失败(例如,在小玩具上
仅几个残基的比对)。 为避免这种情况,或提高自动化系统的稳健性
分析管道,您可以指定字母类型 文件 有了这些选项。
--氨基
指定中的所有序列 文件 是蛋白质。
- 脱氧核糖核酸 指定中的所有序列 文件 是 DNA。
--rna 指定中的所有序列 文件 是 RNA。
配置 控制 安装与施工
这些选项控制如何在对齐中定义共识列。
- 快速地 将共识列定义为分数 >= 的列 符号压裂 残基作为
反对间隙。 (见下文 --symfrac 选项。)这是默认设置。
- 手 使用对多个的引用注释在下一个配置文件中定义共识列
结盟。 这允许您定义您喜欢的任何共识列。
--symfrac
在以下情况下定义定义一致列所需的残留分数阈值
使用 - 快速地 选项。 默认值为 0.5。 每列中的符号分数是
考虑相对序列权重,忽略gap后计算
对应于序列片段结尾的字符(相对于内部
插入/删除)。 将此设置为 0.0 意味着每个对齐列都将
被分配为共识,这在某些情况下可能有用。 将其设置为 1.0
意味着只有包含 0 个间隙(内部插入/删除)的列才会被
作为共识分配。
--fragthresh
如果比对序列已知,我们只想将末端间隙计数为缺失
是全长的,而不是如果它是一个片段(例如,因为只有它的一部分
被测序)。 HMMER 使用一个简单的规则来推断片段:如果序列长度
L 小于或等于一个分数 乘以列的对齐长度,
然后将序列作为片段处理。 默认值为 0.5。 环境
--fragthresh0 将没有(非空)序列定义为片段; 你可能想要
如果您知道自己有一个精心策划的全长对齐方式,请执行此操作
序列。 环境 --fragthresh1 将所有序列定义为片段; 你可能
如果您知道您的比对完全由片段组成,那么想要这样做,例如
作为宏基因组散弹枪数据中翻译的短读。
配置 控制 相对 WEIGHTS
HMMER 使用一种特别的序列加权算法来降低密切相关的序列的权重
并增加远亲的。 这具有使模型减少偏差的效果
不均匀的系统发育表征。 例如,两个相同的序列通常会
每个序列的权重只有一个序列的一半。 这些选项控制哪些
算法被使用。
--wpb 使用 Henikoff 基于位置的序列加权方案 [Henikoff and Henikoff,
J.摩尔。 生物。 243:574, 1994]。 这是默认设置。
——工作组 使用 Gerstein/Sonnhammer/Chothia 加权算法 [Gerstein et al, J. Mol.
生物。 235:1067, 1994]。
--wblosum
使用在计算 BLOSUM 时用于加权数据的相同聚类方案
替代矩阵 [Henikoff and Henikoff, Proc. 国家队阿卡德。 科学 89:10915, 1992]。
序列在同一阈值(默认为 0.62;见
--wid) 并且在每个 c 序列簇内,每个序列获得相对权重
1/c。
--没有
没有相对权重。 所有序列都分配了统一的权重。
--wid
设置单链接聚类使用时的身份阈值 --wblosum.
与任何其他加权方案一起无效。 默认值为 0.62。
其他 配置
--信息
声明输入 文件 是格式 . 目前接受的倍数
比对序列文件格式包括 Stockholm、Aligned FASTA、Clustal、NCBI
PSI-BLAST、PHYLIP、Selex 和 UCSC SAM A2M。 默认是自动检测格式
文件。
- 种子
用种子随机数生成器 , 一个整数 >= 0. 如果 非零,任意
随机模拟将是可重复的; 相同的命令将给出相同的
结果。 如果 为 0,随机数生成器被任意播种,并且
随机模拟会因同一命令的运行而异。 默认的
种子是42。
使用 onworks.net 服务在线使用 alimask