GoGPT Best VPN GoSearch

OnWorks 网站图标

gsnap - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 gsnap

这是 gsnap 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


gsnap - 基因组短读核苷酸比对程序

概要


快照 [配置...] <FASTA 文件>, or 猫| gmap [选项...]

配置


输入 选项 (必须 包括 -d)
-D, --目录=目录
基因组目录。 默认(由 --with-gmapdb 到配置程序)
is /var/缓存/gmap

-d, - D b=STRING
基因组数据库

--use-数组=INT
是否使用后缀数组,这将提高速度。 允许值:0
(否)、1(是,加上 GSNAP/GMAP 算法,默认)或 2(是,并且仅使用后缀)
数组算法)。 请注意,后缀阵列将偏向于 SNP 等位基因
SNP 耐受比对。

-k, --克默=INT
在基因组数据库中使用的 kmer 大小(允许值:16 或更少)如果未指定,
该程序将在基因组数据库中找到最高可用的 kmer 大小

- 采样=INT
用于基因组数据库的采样。 如果未指定,程序将查找
在选定的 k-mer 大小内基因组数据库中的最小可用采样值

-q, - 部分=INT/整数
只处理每 n 个序列中的第 i 个,例如 0/100 或 99/100(对于
将工作分配到计算机农场)。

--输入缓冲区大小=INT
输入缓冲区的大小(程序一次读取这么多序列以提高效率)
(默认 1000)

--条形码长度=INT
从读取开始要移除的条码数量(默认为 0)

- 方向=STRING
双端读数的方向 允许值:FR(fwd-rev,或典型的 Illumina;
默认)、RF(rev-fwd,用于循环插入)或 FF(fwd-fwd,相同链)

--fastq-id-开始=INT
FASTQ 标头中标识符的起始位置,以空格分隔 (>= 1)

--fastq-id-结束=INT
FASTQ 标头中标识符的结束位置,以空格分隔 (>= 1)

例子:

@HWUSI-EAS100R:6:73:941:1973#0/1
开始=1,结束=1(默认)=> 标识符是 HWUSI-EAS100R:6:73:941:1973#0

@SRR001666.1 071112_SLXA-EAS1_s_7:5:1:817:345 length=36
start=1, end=1 => 标识符是 SRR001666.1 start=2, end=2 => 标识符是
071112_SLXA-EAS1_s_7:5:1:817:345 start=1, end=2 => 标识符是 SRR001666.1
071112_SLXA-EAS1_s_7:5:1:817:345

--force-单端
当命令行上提供多个 FASTQ 文件时,GSNAP 假定它们是
匹配的双端文件。 此标志将每个文件视为单端文件。

--过滤器贞操=STRING
跳过由 Illumina 贞操计划标记的读数。 期待一个字符串
在第一个冒号后加入“Y”,如下所示:

@加入 1:Y:0:CTTGTA
其中“Y”表示按贞操过滤。 值:关闭(默认),或者,
两个都。 对于 'either',将过滤双端读取任一端的 'Y'。
对于“both”,双端读取的两端(或唯一的一端)需要一个“Y”
单端读取)。

--allow-pe-名称不匹配
允许读取的登录名在双端文件中不匹配

--gunzip
解压缩 gzip 输入文件

--bunzip2
解压缩 bzip2 压缩的输入文件

计算选项

注意:GSNAP 有一个超快的算法来计算高达和
如:

((readlength+2)/kmer - 2)(“超快不匹配”)。 程序将运行得最快,如果
最大不匹配(加上次优级别)在该值内。 此外,插入缺失,尤其是
结束 indels,需要更长的时间来计算,尽管算法仍然设计得很快。

-B, --批处理=INT
批处理模式(默认值 = 2)

模式偏移位置基因组后缀数组
0 见注 mmap mmap mmap
1 见注释 mmap 和预加载 mmap mmap
2 见注 mmap & preload mmap & preload mmap & preload
3 见注释分配 mmap & preload mmap & preload
(默认) 4 见注释分配分配 mmap 和预加载
5 见注分配分配分配

注意:对于单个序列,所有数据结构都使用mmap
如果 mmap 不可用且未选择分配,则将使用 fileio(非常慢)

关于偏移量的注意事项:可以控制偏移量的扩展
由独立 --扩展偏移量 旗帜。 但是,访问偏移量
在这个版本的 GSNAP 中相对较快。

--使用共享内存=INT
如果为 1(默认值),则分配的内存在此节点上的所有进程之间共享。
如果为 0,则每个进程都有私有分配的内存

--扩展偏移量=INT
是否扩展基因组偏移索引值:0(否,默认)或 1(是)。
扩展提供更快的对齐,但需要更多的内存

-m, --最大不匹配=FLOAT
允许的最大不匹配数(如果未指定,则默认为
((readlength+index_interval-1)/kmer - 2)) 的超快级别(默认情况下,
基因组索引间隔是 3,但这可以通过提供不同的值来改变
HPMC胶囊 -q 处理基因组时到 gmap_build。)

如果指定在 0.0 和 1.0 之间,则作为分数处理
每个读取长度。 否则,视为不匹配的整数
(包括indel和剪接惩罚)对于RNA-Seq,你可能需要增加这个
值稍微对齐延伸超过外显子末端的读数。

--最小覆盖率=FLOAT
对齐所需的最小覆盖范围。 如果指定在 0.0 和 1.0 之间,则
被视为每个读取长度的一部分。 否则,视为积分
碱基对的数量。 默认值为 0.0。

--query-unk-不匹配=INT
是否将查询中的未知 (N) 个字符计为不匹配(0=no(默认),
1=是)

--genome-unk-不匹配=INT
是否将基因组中的未知 (N) 字符计数为不匹配(0=否,1=是
(默认))

--最大搜索=INT
要查找的最大对齐数(默认为 1000)。 必须大于 --n路径,
这是要报告的号码。 保持这个数字很大将允许随机
在多个比对中进行选择。 减少这个数字可以加快
程序。

-i, --indel 惩罚=INT
插入缺失的惩罚(默认为 2)。 允许对不匹配进行计数。 寻找
indels,使 indel-penalty 小于或等于 max-mismatches。 值 < 2 可以
在读取端导致误报

--indel-结束长度=INT
indel 对齐所需的最小末端长度(默认为 4)

-y, --最大中间插入数=INT
允许的最大中间插入次数(默认为 9)

-z, --最大中间删除数=INT 允许的最大中间删除数(默认 30)

-Y, --最大结束插入数=INT
允许的最大插入次数(默认为 3)

-Z, --最大结束删除数=INT
允许的最大结束删除次数(默认为 6)

-M, --次优级别=INT
报告超出最佳命中的次优命中(默认 0)所有具有最佳得分的命中加上
报告了次优水平

-a, --适配器带=STRING
从读取中移除适配器的方法。 当前允许的值:关闭、配对。
默认为“关闭”。 要打开,请指定“配对”,这会从
如果它们似乎存在,则配对末端读取。

--修剪不匹配分数=INT
在末端修剪时用于不匹配的分数(默认为 -3; 把关掉
修剪,指定 0)。 警告:关闭修剪会产生误报
读取结束时不匹配

--修剪插入分数=INT
在末端修剪时用于插入缺失的分数(默认为 -2; 关闭修剪,
指定 0)。 警告:关闭修剪将在
读取结束

-V, --snps目录=STRING
SNP 索引文件的目录(使用 snpindex 创建)(默认为
使用指定的基因组索引文件 -D-d)

-v, --使用-snps=STRING
使用包含已知 SNP 的数据库(在.iit,以前使用
snpindex) 用于对 SNP 的耐受性

--cmet目录=STRING
甲基胞嘧啶索引文件的目录(使用 cmetindex 创建)(默认为
使用指定的基因组索引文件的位置 -D, -V-d)

--阿托迪尔=STRING
A-to-I RNA 编辑索引文件的目录(使用 atoiindex 创建)(默认为
使用指定的基因组索引文件的位置 -D, -V-d)

- 模式=STRING
对齐模式:标准(默认)、cmet-stranded、cmet-nonstranded、atoi-stranded、
atoi-nonstranded、ttoc-stranded 或 ttoc-nonstranded。 非标准模式需要
您以前运行过 cmetindex 或 atoiindex 程序(也包括
ttoc 模式)在基因组上

-t, --n线程=INT
工作线程数

GSNAP 中 GMAP 对齐的选项

--gmap 模式=STRING
使用 GMAP 进行包含多个剪接或插入缺失的复杂比对的案例
允许值:none、all、pairsearch、indel_knownsplice、终端、改进

(或多个值,以逗号分隔)。
默认值:全部,即pairsearch,indel_knownsplice,terminal,improve

--gmap 的触发分数=INT
如果得分最好(两端的总和
如果配对端)超过此值(默认为 5)

--gmap-最小匹配长度=INT
仅当 GMAP 有这么多连续匹配时才保持命中(默认为 20)

--gmap-津贴=INT
GMAP 比对允许额外的不匹配/indel 分数(默认 3)

--max-gmap-pairsearch=INT
对附近的基因组区域执行 GMAP 配对搜索,直到这么多候选
结束(默认 50)。 需要成对搜索 --gmap 模式

--max-gmap-终端=INT
对附近的基因组区域执行 GMAP 终端直到这么多候选端
(默认 50)。 需要终端在 --gmap 模式

--max-gmap-改进=INT
对附近的基因组区域进行 GMAP 改进,直至达到这么多候选末端
(默认 5)。 需要改进 --gmap 模式

--microexon-spliceprob=FLOAT
仅当剪接位点概率之一大于此值时才允许微外显子
值(默认 0.95)

DNA-Seq 的剪接选项

--find-dna-嵌合体=INT
在 DNA-Seq 数据中寻找远距离剪接(0=no(默认),1=yes)自动
对 RNA-Seq 数据失活,如果 -N or -s 指定)

RNA-Seq 的剪接选项

-N, --小说拼接=INT
寻找新的拼接(0=no(默认),1=yes)

--拼接目录=STRING
涉及已知位点或已知内含子的剪接目录,由
-s or --使用拼接 标志(默认是从目录计算 -D-d 标志)。
注意:可以只提供完整的路径名 -s 旗代替。

-s, --使用拼接=STRING
寻找涉及已知位点或已知内含子的剪接(在.iit),在
短距离或长距离 参见 README 说明以了解已知的区别
位点和已知内含子

--ambig-拼接-noclip
对于 read 末端不明确的已知剪接,不要在剪接位点剪断,
而是延伸到内含子中。 仅当您提供
--使用拼接 标志,并且您正试图消除所有软剪辑
--修剪不匹配分数=0

-w, --localsplicedist=INT
本地小说拼接事件定义(默认200000)

--小说结尾拼接者=INT
在读取末端寻找新剪接的距离(默认 50000)

-e, --local-splice-惩罚=INT
局部拼接的惩罚(默认为 0)。 允许不匹配的计数

-E, --远距离拼接惩罚=INT
远距离拼接的惩罚(默认为 1)。 远处的剪接是内含子所在的剪接
长度超过值 -w--localsplicedist, 或者是倒置, 争夺,
或两条不同染色体之间的易位 计数不匹配
允许

-K, --远距离拼接端长度=INT
远距离拼接对齐所需的最小末端长度(默认 20,分钟
允许的值是 -k, 或 kmer 大小)

-l, --shortend-拼接端长度=INT
短端拼接对齐所需的最小末端长度(默认为 2,但
除非提供已知的剪接位点 -s 标志,GSNAP 可能仍需要
结束长度为 -k, 或 kmer 大小以找到给定的接头

--远程剪接身份=FLOAT
远端拼接对齐所需的最小标识(默认 0.95)

--antistranded-惩罚=INT
(目前未实施,因为它会导致结果不佳)
使用链 RNA-Seq 协议时的反链剪接。 正值,
例如 1,期望在第一次读取时反义,在第二次读取时期望。
默认为 0,它平等地对待有义和反义

--合并距离相同
如果可能,将同一染色体上的远距离剪接报告为单个剪接。
将产生一条 SAM 线而不是两条 SAM 线,这也是为
易位、倒位和打乱事件

双端读取的选项

--pairmax-DNA=INT
DNA-Seq 配对读数或其他无剪接读数的最大总基因组长度
(默认 1000)。 如果使用 -N or -s 未指定。

--pairmax-rna=INT
RNA-Seq 配对读数的最大总基因组长度,或其他可能具有
拼接(默认 200000)。 如果使用 -N or -s 被指定。 应该可以匹配
的价值 -w, --localsplicedist.

--pairexpect=INT
预期的双端长度,用于调用双端中间部分的剪接
读取(默认 200)。 在以前的版本中被关闭,但又恢复了。

--pairdev=INT
与预期双端长度的允许偏差,用于调用剪接
双端读取的中间部分(默认 100)。 之前关闭了
版本,但恢复。

质量分数选项

--质量协议=STRING
输入质量分数协议。 允许值:照度(ASCII 64-126)
(相当于 -J 64 -j -31) sanger (ASCII 33-126)(相当于 -J 33 -j 0)

默认为 sanger(无质量打印偏移)
SAM 输出文件应在桑格协议中具有质量分数

或者您可以使用以下标志自定义此行为:

-J, --质量零分=INT
FASTQ 质量分数在此 ASCII 值处为零(sanger 的默认值为 33
协议; 对于 Illumina,选择 64)

-j, --质量打印转移=INT
将 FASTQ 质量分数在输出中按此数量移动(sanger 的默认值为 0
协议; 要将 Illumina 输入更改为 Sanger 输出,请选择 -31)

输出选项

-n, --n路径=INT
要打印的最大路径数(默认为 100)。

-Q, --安静如果过度
如果找到的路径数超过最大数量,则不打印任何内容。

-O, --有序
以与输入相同的顺序打印输出(仅当有多个工人时才相关)
线程)

--显示refdiff
对于 SNP 耐受比对中的 GSNAP 输出,显示相对于
参考基因组为小写(否则,它显示相对于
参考基因组和替代基因组)

--剪辑重叠
对于对齐重叠的双端读取,剪裁重叠区域。

--合并重叠
对于对齐重叠的双端读取,将两端合并为一个端
(测试版实现)

--打印-snps
在读取中打印有关 SNP 的详细信息(仅当 -v 也被选中)
(尚未完全实施)

--failonly
只打印失败的对齐,那些没有结果的对齐

--无故障
排除打印失败的对齐

-A, - 格式=STRING
另一种格式类型,而不是默认值。 当前实施:sam, m8 (BLAST
表格格式)

--分割输出=STRING
Basename 用于多文件输出,分别用于 nomapping、halfmapping_uniq、
halfmapping_mult、unpaired_uniq、unpaired_mult、paired_uniq、paired_mult、
concordant_uniq 和 concordant_mult 结果

-o, - 输出文件=STRING
单个输出结果流的文件名。

--失败输入=STRING
将完全失败的对齐作为输入 FASTA 或 FASTQ 格式打印到给定的
文件,附加 .1 或 .2,用于双端数据。 如果 --分割输出 国旗也是
给定,除了 .nomapping 文件中的输出之外,还会生成此文件。

--附加输出
在规划婴儿食品行业的工艺要求时,安全性和可靠性是工艺设计中最重要的方面。 --分割输出 or --失败输入 给出,此标志会将输出附加到
现有文件。 否则,默认是创建新文件。

--最好的排序=STRING
在与最佳分数相关的比对中,按此顺序对这些比对进行排序。
允许值:基因组、随机(默认)

--输出缓冲区大小=INT
查询中的缓冲区大小,用于输出线程(默认为 1000)。 当数
要打印的结果超过此大小,工作线程将暂停,直到
积压被清除

SAM 输出选项

--无 sam 标头
不要打印以“@”开头的标题

--add-paired-nomappers
根据需要添加 nomapper 行,以使所有双端结果在第一个之间交替
终点和第二个终点

--配对标志意味着一致=INT
SAM 标志中的配对位是表示仅一致 (1) 还是配对加
一致(0,默认)

--sam-标头-批处理=INT
仅为此批次打印标题,如指定的那样 -q

--sam-使用-​​0M
在 CIGAR 中相邻的插入和删除之间插入 0M 皮卡德要求,
但可能会导致其他工具出错

--sam-多重初选
允许将多个对齐标记为主要对齐,如果它们具有相同的好
映射分数

--force-xs-目录
对于 RNA-Seq 比对,不允许 XS:A:? 当感觉方向不清楚时,和
用 XS:A:+ 任意替换此值。 可能对某些程序有用,例如
作为袖扣,无法处理 XS:A:?。 但是,如果您使用此标志,则
在这些情况下 XS:A:+ 的报告值将没有意义。

--md-小写-snp
在 MD 字符串中,当已知 SNP 由 -v 旗帜,印刷差异
当核苷酸与参考不同但与已知匹配时,核苷酸为小写
替代等位基因

--extend-soft-剪辑
通过软剪切区域扩展对齐

--action-if-cigar-错误
如果 CIGAR 长度和序列长度不一致时采取的措施
允许值:ignore、warning、noprint(默认)、abort

--读取组ID=STRING
要放入读取组 ID (RG-ID) 字段的值

--读取组名称=STRING
要放入读取组名称 (RG-SM) 字段的值

--读取组库=STRING
放入读取组库 (RG-LB) 字段的值

--读取组平台=STRING
放入读取组库 (RG-PL) 字段的值

帮助选项

- 查看
检查编译器假设

- 版
显示版本

- 帮帮我 显示此帮助消息

GMAP套件的其他工具位于/usr/lib/gmap

使用 onworks.net 服务在线使用 gsnap


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad




×
广告
❤️在这里购物、预订或购买——免费,有助于保持服务免费。