英语法语西班牙语

Ad


OnWorks 网站图标

maq - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 maq

这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令 maq,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


Maq - 具有质量的映射和组装

概要


q 命令 [选项] 参数

模板文件 命令 [选项] 参数

商品描述


Maq 是一种软件,它根据下一个生成的短读来构建映射程序集-
代测序机。 它是专门为 Illumina-Solexa 1G 基因设计的
分析器,并具有处理 AB SOLiD 数据的初步功能。

使用 Maq,您可以:

· 将 Illumina/SOLiD 读数与参考基因组快速对齐。 使用默认选项,一
可以在大约 10 个 CPU 小时内将数百万对读数映射到人类基因组
超过1G内存。

· 准确测量每一个reads比对的错误概率。

· 调用共有基因型,包括纯合和杂合多态性,
分配给每个碱基的 Phred 概率质量。

· 找到具有配对末端读取的短插入缺失。

· 通过配对末端读取准确找到大规模基因组缺失和易位。

· 通过检查读取深度发现潜在的 CNV。

· 评估来自测序仪的原始碱基质量的准确性并帮助检查
系统误差。

但是,马克可以 不是:

· 做 de 集会。 (Maq 只能通过将读取映射到已知的
参考。)

· 地图短裤自相矛盾。 (Maq 只能找到读取之间的完全重叠。)

· 将毛细管读数或 454 读数与参考对齐。 (Maq 不能对齐读取超过
63bp。)

空气质量 指令


命令

快速2bfa q 快速2bfa in.ref.fasta 中 输出引用bfa

将 FASTA 格式的序列转换为 Maq 的 BFA(二进制 FASTA)格式。

快速q2bfq q 快速q2bfq [-n nreads] 在.read.fastq 读.bfq外前缀

将 FASTQ 格式的读数转换为 Maq 的 BFQ(二进制 FASTQ)格式。

选项:

-n INT 每个文件的读取次数 [未指定]

地图 q 地图 [-n 纳米[-a 最大值[-c[-1 len1[-2 len2[-d 适配3[-m 变异]
[-u 未映射] [-e 最大错误[-M cg] [-N[-H 热门歌曲[-C 最大命中] 地图
参考文献 在.read1.bfq [在.read2.bfq] 2> 输出.map.log

将读取映射到参考序列。

选项:

-n INT 总能找到的最大不匹配数 [2]

-a INT 正确读取对的最大外部距离 [250]

-A INT 两个射频付费读取的最大外部距离(0 表示禁用)[0]

-c 颜色空间中的映射读取(仅适用于 SOLiD)

-1 INT 第一次读取的读取长度,0 表示自动 [0]

-2 INT 第二次读取的读取长度,0 表示自动 [0]

-m FLOAT 参考序列和读数之间的突变率 [0.001]

-d 文件 指定包含单行 3'-适配器序列的文件
[空值]

-u 文件 转储未映射的读取和包含超过 纳米 不匹配
一个单独的文件 [null]

-e INT 不匹配基础质量总和的阈值 [70]

-H 文件 将多个/所有 01 不匹配命中转储到 文件 [空值]

-C INT 输出的最大命中数。 如果大于 512,则无限制。 [250]

-M cg甲基化对齐模式。 正向链上的所有 C(或 G)将是
更改为 T(或 A)。 此选项仅用于测试。

-N 将不匹配位置存储在输出文件中 地图。 当这个
选项正在使用中,允许的最大读取长度为 55bp。

注意:

* 成对的末端读取应准备在两个文件中,每个末端一个,与
读取按相同顺序排序。 这意味着第 k 个读取
文件与第二个文件中的第 k 个读取匹配。 对应的读
名称必须与尾随的“/1”或“/2”相同。 例如,这样一个
允许读取名称对:`EAS1_1_5_100_200/1' 和
`EAS1_1_5_100_200/2'。 尾随‘/[12]’通常由
GAPipeline 来区分成对的两端。

* 输出是一个压缩的二进制文件。 它受字节序的影响。

* 运行此命令的最佳方式是提供大约 1 到 3 万次读取作为
输入。 更多的读取消耗更多的内存。

* 选项 -n 控制对齐的灵敏度。 默认情况下,命中
总能找到最多 2 个不匹配。 更高 -n 找到更多的点击,并且
提高了映射质量的准确性。 然而,这是有代价的
的速度。

* 有许多高质量错配的比对应作为错误丢弃
对齐或可能的污染。 此行为由选项控制
-e。 该 -e 阈值只是近似计算,因为基本质量
在对齐的某个阶段除以 10。 这 -Q 在选项
聚集 命令精确设置阈值。

* 一对reads被认为是正确配对的当且仅当
方向是 FR 并且该对的外部距离不大于
最大值. 最小插入尺寸没有限制。 这个设置是
由 Maq 中使用的配对末端对齐算法确定。 需要一个
最小刀片尺寸将导致一些错误的对齐方式
高估了映射质量。

* 目前,来自 Illumina/Solexa 长插入库的读取对具有 RF 读取
方向。 最大插入尺寸由选项设置 -A. 然而,长——
插入库也混合了一小部分短插入读取
对。 -a 也应该正确设置。

* 有时可能会对 5'-末端甚至整个 3'-接头序列进行测序。
提供 -d 渲染 Maq 以消除适配器污染。

* 给定 2 万次读取作为输入, q 通常需要800MB内存。

地图合并 q 地图合并 地图 in.aln1.map in.aln2.map [...]

将一批读取对齐合并在一起。

注意:

* 理论上,此命令可以合并无限数量的对齐。 然而,作为
mapmerge 将同时读取所有输入,它可能会命中
操作系统设置的最大打开文件数限制。 目前,这
必须由最终用户手动解决。

* 命令 地图合并 可用于合并不同read的对齐文件
长度。 所有后续分析不再假设固定长度。

备份 q 备份 输出.rmdup.map 在.ori.map

删除具有相同外部坐标的对。 原则上,与
相同的外部坐标应该很少发生。 然而,由于
在样品制备过程中进行扩增,这种情况比通过
机会。 实际分析表明,删除重复项有助于提高
SNP 调用的整体准确性。

聚集 q 聚集 [-sp[-m 最大值[-Q 最大错误[-r 加热[-t 系数[-q 最小Q[-N
nHap] 出.cns 参考文献 在.aln.map 2> 输出.cns.log

从读取映射中调用一致序列。

选项:

-t FLOAT 误差相关系数 [0.93]

-r FLOAT 所有位点中杂合子的比例 [0.001]

-s 以单端映射质量作为最终映射质量;
否则将使用配对的末端映射质量

-p 丢弃未以正确配对映射的配对末端读取

-m INT 允许使用读取的最大不匹配数
共识呼吁 [7]

-Q INT 错配碱基质量值的最大允许总和 [60]

-q INT 允许以一致方式使用读取的最低映射质量
呼叫 [0]

-N INT 池中的单倍型数 (>=2) [2]

注意:

* 选项 -Q 对不匹配的基本质量的最大总和设置限制。
应丢弃包含许多高质量错配的读取。

* 选项 -N 设置池中单倍型的数量。 它是专为
通过将多个菌株/个体汇集在一起​​来对样品进行重新测序。 为了
二倍体基因组重测序,此选项等于 2。

基因 q 基因 [-sp[-m 最大值[-Q 最大错误[-r 加热[-t 系数[-q 最小Q[-N
nHap] 出.cns 参考文献 在.aln.map 2> 输出.cns.log

计算所有基因型的对数似然并以 GLF 格式存储结果
(基因分型可能性格式)。 详情请查看 MAQ 网站
文件格式和相关实用程序的描述。

因德尔佩 q 因德尔佩 参考文献 在.aln.map > 输出.indelpe

从成对的末端读取调用一致的插入缺失。 输出以制表符分隔
每行由染色体、起始位置、插入缺失类型、数量组成
插入/删除的读取数、插入/删除的大小和插入/删除的核苷酸
(以冒号分隔),反向链上的插入缺失数,插入缺失数
在正向链上,插入缺失之前的 5' 序列,随后的 3' 序列
indel、没有 indel 对齐的读取数和三个额外的列
用于过滤器。

在第 3 列,插入删除类型,星号表示插入删除已确认
通过从两条链读取,加号表示插入缺失至少被两个读取击中
但在同一条链中,减号表示插入缺失仅在一次读取中发现,
一个点表示 indel 与另一个 indel 太接近并被过滤掉。

建议用户通过运行`maq.pl indelpe'来修正
读取映射而没有插入。 有关更多详细信息,请参阅`maq.pl indelpe'
部分。

英德尔索阿 q 英德尔索阿 参考文献 在.aln.map > 出.indelsoa

通过检测异常来调用潜在的纯合插入和断点
indel 和断点周围的对齐模式。 输出也是TAB
用染色体、近似坐标、
异常区域的长度,跨位置映射的读取数,
位置左侧的读取次数和读取次数
右侧。 最后一列可以忽略。

输出包含许多误报。 推荐的过滤器可能是:

awk '$5+$6-$4 >= 3 && $4 <= 1' indelsoa

请注意,此命令的目标不是成为准确的 indel 检测器,而是
主要有助于避免替换调用中的一些误报。 在
此外,它只适用于深度较深的情况(例如~40X); 否则
假阴性率会非常高。

格式 转换

索尔2桑格 q 索尔2桑格 在.sol.fastq 出.sanger.fastq

将 Solexa FASTQ 转换为标准/Sanger FASTQ 格式。

bfq2fastq q bfq2fastq 读入.bfq 读出.fastq

将 Maq 的 BFQ 格式转换为标准的 FASTQ 格式。

mappass2maq q mappass2maq in.mappass2.map 输出.maq.map

将过时的 mapass2 的地图格式转换为 Maq 的地图格式。 旧格式
不包含读取名称。

资讯 提取中

地图视图 q 地图视图 [-bN] 在.aln.map > 输出.aln.txt

以纯文本显示读取对齐。 对于在 Smith- 之前对齐的读取
Waterman 比对,每行由 read 名称、染色体、位置、
链,来自一对外部坐标的插入大小,配对标志,映射
质量,单端映射质量,替代映射质量,数量
最佳命中的不匹配,最佳的不匹配碱基的质量总和
命中,前 0bp 的 24 不匹配命中数,1 不匹配命中数
参考文献的前 24bp、read 的长度、read 序列及其
质量。 替代映射质量总是等于映射质量,如果
读取不配对。 如果读取配对,则等于较小的映射
两端的质量。 这种替代映射质量实际上是
异常对的映射质量。

第五列,成对标志,是按位标志。 它的低 4 位给出
方向:1代表FF,2代表FR,4代表RF,8代表RR,其中FR表示
具有较小坐标的读取位于正向链上,其配对是
在反向链上。 正确的配对只允许使用 FR。 较高的位
这个标志提供了进一步的信息。 如果对遇到对端
要求,将设置 16。 如果两个读取被映射到不同的
染色体,32 将被设置。 如果两个读取之一根本无法映射,
64 将被设置。 正确对的标志总是等于 18。

对于之后由 Smith-Waterman 对齐对齐的读取,标志是
总是 130. 一行由读取名称、染色体、位置、链、插入组成
大小,标志(始终为 130),读取中插入缺失的位置(如果没有插入,则为 0),
indels 的长度(插入为正,删除为负),
其配偶的映射质量,最佳命中的不匹配数,总和
最佳命中的不匹配碱基的质量,两个零,读取长度,
读取序列及其质量。 标记为 130 的读取的伴侣总是得到一个
标志 18.

标志 192 表示读取未映射但其配对已映射。 对于这样
一对读取,一个读取的标志为 64,另一个读取的标志为 192。

选项:

-b 不显示读取序列和质量

-N 显示出现不匹配的位置。 此标志仅适用
使用由`maq map -N' 生成的 .map 文件。

地图检查 q 地图检查 [-s[-m 最大值[-q 最小Q] 参考文献 在.aln.map > 输出地图检查

阅读质量检查。 mapcheck首先报告构成和深度
参考资料。 之后有一个表格。 第一列表示
读取位置。 以下四列显示核苷酸
将给出参考和读数之间的替代率。
这些比率和以下列中的数字按比例缩放至 999 和
四舍五入到最接近的整数。 下一组列显示了分布
质量间隔为 10 的读数的基本质量。质量下降
通常可以观察到,这意味着读取末尾的碱基较少
准确的。 最后一组列表示替换的分数
以质量间隔读取碱基。 这衡量了基础质量的准确性
估计。 理想情况下,我们希望在 1 中看到 3? 列,10 在 2? 柱子
和 100 中的 1? 柱子。

选项:

-s 以单端映射质量作为最终映射质量

-m INT 允许对读取进行计数的最大错误数 [4]

-q INT 允许对读取进行计数的最低映射质量 [30]

积累 q 积累 [-spvP[-m 最大值[-Q 最大错误[-q 最小Q[-l 站点文件] 参考文献
在.aln.map > 外堆积

以“堆积”文本格式显示对齐。 每行由
染色体、位置、参考碱基、深度和覆盖读取的碱基
这个位置。 如果 -v 在命令行中添加,基本质量和映射
质量将按顺序在第六列和第七列中呈现。

第五列总是以“@”开头。 在此列中,读取碱基相同
引用以逗号“,”或点“.”显示,并且阅读基数不同
来自信件中的参考。 逗号或大写表示基数
来自前向链上对齐的读取,而点或小写的
反向链。

此命令适用于想要开发自己的 SNP 调用程序的用户。

选项:

-s 以单端映射质量作为最终映射质量

-p 丢弃未映射为正确对的配对末端读取

-v 输出详细信息,包括基本质量和映射
气质

-m INT 允许使用读取的最大不匹配数 [7]

-Q INT 不匹配的最大允许质量值数量 [60]

-q INT 允许使用读取的最低映射质量 [0]

-l 文件 包含将打印出堆积的站点的文件。 在这
文件第一列给出引用的名称,第二列给出
该坐标。 其他列将被忽略。 [空值]

-P 还输出读取的基本位置

cns2fq q cns2fq [-Q 最小映射Q[-n 小妮子[-d 最小深度[-D 最大深度] .cns >
出.cns.fastq

以 FASTQ 格式提取一致序列。 在序列行中,碱基
在小写中基本上是重复的或没有足够的覆盖率; 基地
大写字母表示可以可靠调用 SNP 的区域。 在里面
质量行,字符减去 33 的 ASCII 给出 ​​PHRED 质量。

选项:

-Q INT 最低映射质量 [40]

-d INT 最小读取深度 [3]

-n INT 最小相邻质量 [20]

-D INT 最大读取 dpeth。 >=255 无限制。 [255]

cns2snp q cns2snp .cns > 出.snp

提取 SNP 位点。 每条线由染色体、位置、参考碱基、
共识基础,类似Phred的共识质量,阅读深度,平均阅读次数
覆盖该位置的读取命中数,读取的最高映射质量
覆盖位置,3bp侧翼的最低共识质量
站点每一侧的区域(共 6bp),次佳调用,记录
次优和次优调用的似然比,以及次优调用的似然比
呼叫。

第 5 列是您判断 SNP 可靠性的关键标准。
但是,由于此质量仅在假设站点独立的情况下计算,因此您
还应该考虑其他列以获得更准确的 SNP 调用。 脚本
命令`模板文件 SNP过滤器' 是为此而设计的(见下文)。

第 7 列暗示该站点是否属于重复区域。 如果不
读取覆盖站点可以以高映射质量映射,侧翼
区域可能是重复的或缺乏良好的读取。 此类站点的 SNP
通常是不可靠的。

第 8 列粗略地给出了侧翼区域的拷贝数
参考基因组。 在大多数情况下,这个数字接近 1.00,这意味着
地区是独一无二的。 有时您可能会看到非零读取深度,但在 0.00
第 7 列。 这表明覆盖该位置的所有读数都在
至少有两个不匹配。 Maq 只计算 0 和 1 不匹配命中的数量
参考资料。 这是由于一个复杂的技术问题。

第 9 列给出了相邻质量。 过滤此列也是
需要获得可靠的 SNP。 这个想法受到 NQS 的启发,虽然 NQS 是
最初设计为单次阅读而不是共识。

cns2视图 q cns2视图 .cns > 外景

在所有站点显示详细信息。 输出格式与
cns2snp 报告。

cns2ref q cns2ref .cns > 输出.ref.fasta

提取参考序列。

cns2win q cns2win [-w 大小[-c CHR[-b 开始[-e 结束[-q 最小Q] .cns >
胜出

提取在耕作窗口中平均的信息。 输出以 TAB 分隔,
其中包括参考名称、坐标除以 1,000,000、SNP 率、
het 率、原始读取深度、近似唯一区域的读取深度、
窗口中读取的平均命中数和 GC 百分比。

选项:

-w INT 窗口大小 [1000]

-c STR 目标参考序列; 否则将使用所有引用
[空值]

-b INT 开始位置,0 表示无约束 [0]

-e INT 结束位置,0 表示无约束 [0]

-q INT 要使用的网站的最低共识质量 [0]

模拟 有关

假货 q 假货 [-r 变异[-R 失压] in.ref.fasta 中 > out.fakeref.fasta 2>
假冒文件

随机向参考引入替换和插入。 替代品和
可以添加单个碱基对插入缺失。

选项:

-r FLOAT 突变率 [0.001]

-R FLOAT 插入缺失的突变比例 [0.1]

模拟火车 q 模拟火车 模拟参数.dat 在.read.fastq

用于读取模拟的估计/训练参数。

模拟 q 模拟 [-d 在尺寸方面[-s 标准差[-N 读取次数[-1 读取长度1[-2 读取长度2[-r
变率[-R 插入断裂[-h] 输出.read1.fastq 输出.read2.fastq in.ref.fasta 中
类似物.dat

模拟配对末端读取。 文件 类似物.dat 确定读取长度和
质量分布。 它是由 模拟火车,或者可以从
马克网站。 在输出读取文件中,读取名称由引用组成
序列名称和模拟读数对的外部坐标。 经过
默认, 模拟 假设读取来自生成的二倍体序列
通过添加两组不同的突变,包括一个碱基对插入缺失,
in.ref.fasta 中.

选项:

-d INT 刀片尺寸外距的平均值 [170]

-s INT 刀片尺寸的标准偏差 [20]

-N INT 要生成的读取对数 [1000000]

-1 INT 第一次读取的长度 [由 类似物.dat]

-2 INT 第二次阅读的长度 [由 类似物.dat]

-r FLOAT 突变率 [0.001]

-R FLOAT 1bp 插入缺失的部分 [0.1]

-h 将所有突变添加到 in.ref.fasta 中 并从单个生成读取
突变序列(单倍体模式)

注意:

* 此命令产生的读取是独立的,这偏离了
真相。 而对齐评估受此影响较小,评估
应谨慎执行 SNP 调用。 错误依赖可能是其中之一
错误 SNP 调用的主要原因。

司马司他 q 司马司他 模拟地图 > 模拟输出

从模拟读取评估映射质量。

坚硬的 有关

快速2CSFA q 快速2CSFA in.nucl-ref.fasta > out.color-ref.fasta

将核苷酸 FASTA 转换为颜色编码的 FASTA。 旗帜 -c 然后应该应用
地图 命令。 在输出中,字母‘A’代表颜色0,‘C’代表1,‘G’
2 和'T' 3。输出中的每个序列都比输入短 1bp。

csmap2nt q csmap2nt 地图 参考文献bfa 在.cs.map

将颜色对齐转换为核苷酸对齐。 输入 参考文献bfa
核苷酸二进制 FASTA 参考文件。 它必须与原始文件相对应
从中转换颜色参考。 核苷酸共识可称为
从结果对齐。

杂项/高级 命令

子图 q 子图 [-q 最小映射Q[-Q 最大和错误[-m 最大MM[-p] 外地图 地图

过滤错误的对齐方式 地图. 命令行选项在
`聚集' 命令。

伊兰2马克 q 伊兰2马克 [-q 不合格] 外地图 清单 内陆

将 eland 对齐转换为 maq 的 .map 格式。 文件 清单 由...组成
出现在 eland 比对文件第七列的序列名称
内陆 以及您希望在 maq 对齐中看到的名称。 以下是一个
例:

fa chrX
c1.fa chr1
c2.fa chr2

如果您使用 eland 对齐多个批次的读数,重要的是
使用相同 清单 为转换。 此外,maq 将加载所有
对齐并在内存中对它们进行排序。 如果你连接了几个 eland
输出到一个大文件,你应该把它分成更小的文件
防止 maq 吃掉你所有的机器内存。

这个命令实际上是为了在 Maqview 中显示 Eland 对齐。 因为没有质量
信息可用,不应使用生成的 maq 对齐文件
称为共识基因型。

出口2maq q 出口2maq [-1 读1len[-2 读2len[-a 最大分布[-n] 外地图 清单
进出口

将 Illumina 的导出格式转换为 Maq 的格式 。地图 格式。 导出格式是新的
自 SolexaPipeline-0.3.0 以来的对齐格式也计算映射
像 maq 一样的品质。 生成的文件可用于调用共识基因型
因为 maq 可以获得大多数必要的信息来准确地做到这一点。

选项:

-1 INT 第一次读取的长度 [0]

-2 INT 第二次读取的长度 [0]

-a INT 正确读取对的最大外部距离 [250]

-n 保留过滤读取

MAQ-PERL 指令


演示 模板文件 演示 [-h[-s[-N n对[-d 出处] 法斯塔 模拟数据

演示使用 q 及其配套脚本。 该命令将
模拟从 FASTA 文件读取 法斯塔. 序列长度和质量
由...决定 模拟数据 这是从 q 模拟火车 或者可以是
从 Maq 网站下载。 然后将模拟读取映射为
模板文件 易跑. 对准精度由 q 司马司他是,
共识准确性由 q 模拟,SNP 准确度为 maq_eval.pl.

默认情况下,将模拟成对的末端读数,并生成二倍体序列
通过向任一单倍体类型添加突变从输入生成。 插入
大小和突变率由控制 q 模拟.

选项:

-h 模拟单倍体序列而不是二倍体序列

-s 使用单端模式来对齐读取而不是双端模式

-N INT 要模拟的读取对数 [1000000]

-d DIR 输出目录 [maqdemo]

注意:

* 输出文件来自 maq_eval.pl 尚未记录,但您可以
对其中一些文件的一个很好的猜测。

* 该命令仅演示 maq 套件的使用。 真实准确率
数据几乎总是低于您从纯模拟中看到的数据。

易跑 模板文件 易跑 [-1 读1Len[-d 目录[-n 读取次数[-A 3个适配器[-e 最小深度]
[-q 分钟CnsQ[-p[-2 读2Len[-a 最大输入[-S[-N] in.ref.fasta 中 in1.fastq
[in2.fastq]

分析小基因组的管道。 Easyrun 命令将运行大部分分析
实施 q。 默认, 易跑 假设所有输入读取序列
文件是单端和独立的; 什么时候 -p 被指定,两个读取序列
文件是必需的,每端一个。

会生成几个文件 目录,其中有以下文件
关键输出:

cns.final.snp文件 过滤掉低质量的最终 SNP 调用

中文网 FASTQ 格式的共有序列和质量

选项:

-d DIR 输出目录 [easyrun]

-n INT 一批比对中的读取数/对数 [2000000]

-S 应用短插入的拆分读取分析(可能很慢)

-N INT 池中单倍型/菌株的数量 (>=2) [2]

-A 文件 3'-适配器文件。 该文件应包含一行序列
[空值]

-1 INT 第一次读取的长度,0 表示自动 [0]

-e INT 调用 SNP 所需的最小读取深度(对于 SNPfilter)[3]

-q INT SNP 的最低共识质量 cns.final.snp文件 [30]

-p 切换到双端对齐模式

-2 INT 第二次阅读的长度 -p 已应用 [0]

-a INT 最大插入尺寸时 -p 已应用 [250]

笔记:

* 对于汇集样本的 SNP 调用,用户应设置正确的`-N' 也
`-E 0'。

* 输入文件可以是maq 的二进制格式。 模板文件 会自动检测
文件格式。

SNP过滤器 模板文件 SNP过滤器 [-d 最小深度[-D 最大深度[-Q 最大映射Q[-q 分钟CnsQ[-w
插入窗口大小[-n 小妮子[-F indelpe[-f indelsoa[-s 最低分[-m
最大跨度[-a[-N 最大WinSNP[-W 密度WinSize] in.cns2snp.snp文件 >
过滤后的snp

排除被少量读取覆盖的 SNP(由 -d), 太多了
读取(由 -D),附近(由指定 -w) 到潜在的插入缺失,下降
在一个可能的重复区域(特征是 -Q),或质量低
相邻碱基(由 -n)。 如果 最大WinSNP 或多个 SNP 出现在任何
密度WinSize 窗口,它们也会一起被过滤掉。

选项:

-d INT 调用 SNP 所需的最小读取深度 [3]

-D INT 调用 SNP 所需的最大读取深度(<255,否则忽略)
[256]

-Q INT 覆盖 SNP 的读数所需的最大映射质量 [40]

-q INT 最低共识质量 [20]

-n INT 最小相邻共识质量 [20]

-w INT 潜在插入缺失周围的窗口大小。 接近的 SNP
插入插入将被抑制 [3]

-F 文件 因德尔佩 输出 [空]

-f 文件 英德尔索阿 输出 [空]

-s INT 要考虑的 soa-indel 的最低分数 [3]

-m INT 可以跨 soa-indel 映射的最大读取数 [1]

-a 用于单端对齐的替代过滤器

因德尔佩 模板文件 因德尔佩 indelpe > 输出.indelpe

更正在没有插入缺失的情况下为均聚物束映射的读取数。 这个
命令修改第 4、10 和最后三列 indelpe
输出结果 输出.indelpe. 修正后如下 AWK
命令给出假定的纯合插入缺失:

awk '$3=="*"(使用$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

下面给出了杂合子:

awk '$3=="*"(美国$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

请注意,这 因德尔佩 命令只是实现了几个启发式规则。
它不能校正不纯的均聚物运行或二核苷酸/三联体
重复。 因此,两个 awk 命令只给出近似的 hom/het
插入缺失。

示例


· Easyrun 脚本:
maq.pl easyrun -d easyrun ref.fasta 第 1 部分.fastq 第 2 部分.fastq

·easyrun背后的关键命令:
maq fasta2bfa 参考.fasta 参考.bfa;
maq fastq2bfq 部分1.fastq 部分1.bfq;
maq fastq2bfq 部分2.fastq 部分2.bfq;
maq 地图 part1.map ref.bfa part1.bfq;
maq 地图 part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq 组装 cns.cns ref.bfa aln.map;

使用 onworks.net 服务在线使用 maq


免费服务器和工作站

下载 Windows 和 Linux 应用程序

  • 1
    移相器
    移相器
    Phaser 是一个快速、免费且有趣的开放式
    源 HTML5 游戏框架,提供
    WebGL 和 Canvas 渲染
    桌面和移动网络浏览器。 游戏
    可以共...
    下载移相器
  • 2
    附庸引擎
    附庸引擎
    VASSAL 是一个游戏引擎,用于创建
    电子版传统板
    和纸牌游戏。 它提供支持
    游戏块渲染和交互,
    和...
    下载 VASSAL 引擎
  • 3
    OpenPDF - iText 的分支
    OpenPDF - iText 的分支
    OpenPDF 是一个 Java 库,用于创建
    以及使用 LGPL 编辑 PDF 文件和
    MPL 开源许可证。 OpenPDF 是
    iText 的 LGPL/MPL 开源继承者,
    一个...
    下载 OpenPDF - iText 的分支
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - 自动化系统
    地球科学分析 - 是地理
    信息系统 (GIS) 软件
    地理数据的强大功能
    加工和分析...
    下载 SAGA GIS
  • 5
    Java/JTOpen 工具箱
    Java/JTOpen 工具箱
    IBM Toolbox for Java / JTOpen 是一个
    Java类库支持
    客户端/服务器和互联网编程
    模型到运行 OS/400 的系统,
    i5/OS, 哦...
    下载 Java/JTOpen 工具箱
  • 6
    D3.js
    D3.js
    D3.js(或数据驱动文档的 D3)
    是一个 JavaScript 库,它允许你
    生成动态的交互式数据
    Web 浏览器中的可视化。 与D3
    您...
    下载 D3.js
  • 更多 ”

Linux 命令

Ad