英语法语西班牙语

Ad


OnWorks 网站图标

gmap - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 gmap

这是 gmap 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


gmap - 基因组映射和比对程序

概要


地图 [配置...] <FASTA ...>, or 猫| gmap [选项...]

配置


输入 选项 (必须 包括 -d or -g)
-D, --目录=目录
基因组目录。 默认(由 --with-gmapdb 到配置程序)
is /var/缓存/gmap

-d, - D b=STRING
基因组数据库。 如果参数是 '?' (带引号),此命令列出
可用的数据库。

-k, --克默=INT
在基因组数据库中使用的 kmer 大小(允许值:16 或更少)。 如果不
指定,程序将在基因组中找到最高可用的 kmer 大小
数据库

- 采样=INT
用于基因组数据库的采样。 如果未指定,程序将查找
在选定的 k-mer 大小内基因组数据库中的最小可用采样值

-G, --全基因组
使用完整基因组(允许使用所有 ASCII 字符;在设置期间明确构建),而不是
压缩版

-g, --gseg=文件名
用户提供的基因组片段

-1, --自对齐
通过标准输入以 FASTA 格式将一个序列与自身对齐(用于获取
核苷酸序列的蛋白质翻译)

-2, --pairalign
通过标准输入以 FASTA 格式对齐两个序列,第一个是基因组,第二个是
一个是 cDNA

--命令行=STRING,细绳
对齐命令行上提供的这两个序列,第一个是基因组和
第二个是 cDNA

-q, - 部分=INT/整数
只处理每 n 个序列中的第 i 个,例如 0/100 或 99/100(对于
将工作分配到计算机农场)。

--输入缓冲区大小=INT
输入缓冲区的大小(程序一次读取这么多序列以提高效率)
(默认 1000)

计算选项

-B, --批处理=INT
批处理模式(默认值 = 2)

模式偏移位置基因组
0 见注 mmap mmap
1 见注释 mmap 和预加载 mmap
(默认) 2 见注释 mmap & preload mmap & preload
3 见注释分配 mmap 和预加载
4 见注分配分配
5 展开分配分配

注意:对于单个序列,所有数据结构都使用mmap
如果 mmap 不可用且未选择分配,则将使用 fileio(非常慢)

关于 --批处理 和偏移量:可以控制偏移量的扩展
由独立 --扩展偏移量 旗帜。 这 --批处理=5 选项相当于
--批处理=4--扩展偏移量=1

--扩展偏移量=INT
是否扩展基因组偏移索引值:0(否,默认)或 1(是)。
扩展提供更快的对齐,但需要更多的内存

--nosplicing
关闭剪接(用于将基因组序列与基因组对齐)

--min-内含子长度=INT
一个内部内含子的最小长度(默认为 9)。 低于这个大小,基因组缺口
将被视为删除而不是内含子。

-K, --内含子长度=INT
一个内部内含子的最大长度(默认 200000)

-w, --localsplicedist=INT
序列末端已知剪接位点的最大长度(默认 2000000)

-L, - 总长度=INT
最大总内含子长度(默认 2400000)

-x, --嵌合边距=INT
触发搜索剩余序列的未对齐序列的数量
(默认 30)。 启用嵌合读数的对齐,并可能有助于某些
非嵌合读取。 要关闭,请设置为零。

--没有嵌合体
关闭寻找嵌合体。 效果一样 --嵌合边距=0

-t, --n线程=INT
工作线程数

-c, --chr子集=绳子
限制搜索到给定的染色体

-z, - 方向=STRING
cDNA 方向(sense_force、antisense_force、sense_filter、antisense_filter 或
自动(默认))

-H, --曲门地松=INT
修剪少于给定匹配数的末端外显子(在 nt 中,默认为 9)

--规范模式=INT
规范和半规范内含子的奖励 0=低奖励,1=高奖励
(默认),2=高身份序列奖励低,否则高奖励

--跨物种
对规范拼接使用更敏感的搜索,这尤其有助于
跨物种比对和其他困难案例

--允许关闭插入=INT
允许彼此靠近的插入和删除(0=否,1=是(默认),2=仅
用于高质量对齐)

--microexon-spliceprob=FLOAT
仅当剪接位点概率之一大于此值时才允许微外显子
值(默认 0.95)

--cmet目录=STRING
甲基胞嘧啶索引文件的目录(使用 cmetindex 创建)(默认为
使用指定的基因组索引文件的位置 -D, -V-d)

--阿托迪尔=STRING
A-to-I RNA 编辑索引文件的目录(使用 atoiindex 创建)(默认为
使用指定的基因组索引文件的位置 -D, -V-d)

- 模式=STRING
对齐模式:标准(默认)、cmet-stranded、cmet-nonstranded、atoi-stranded、
atoi-nonstranded、ttoc-stranded 或 ttoc-nonstranded。 非标准模式需要
您以前运行过 cmetindex 或 atoiindex 程序(也包括
ttoc 模式)在基因组上

-p, --修剪级别
修剪级别:0=不修剪(默认),1=较差的序列,2=重复的序列,3=较差和
重复的

输出类型

-S, - 概括
仅显示比对摘要

-A, - 对齐
显示路线

-3, - 连续
以三条连续线显示对齐方式

-4, --逐个外显子连续
每个外显子以三行显示对齐

-Z, - 压缩
以压缩格式打印输出

-E, --外显子=STRING
打印外显子(“cdna”或“基因组”)

-P, --蛋白质_DNA
打印蛋白质序列 (cDNA)

-Q, --蛋白质生成
打印蛋白质序列(基因组)

-f, - 格式=INT
其他输出格式(另请注意 -A-S 列出的选项和其他选项
在输出类型下):
psl (或 1) = PSL (BLAT) 格式,
gff3_gene (或 2) = GFF3 基因格式,
gff3_match_cdna (或 3) = GFF3 cDNA_match 格式,
gff3_match_est (或 4) = GFF3 EST_match 格式,
splicesites(或 6)= splicesites 输出(用于 GSNAP 拼接文件),
introns = 内含子输出(用于 GSNAP 拼接文件),
map_exons (或 7) = IIT FASTA 外显子图格式,
map_ranges (或 8) = IIT FASTA 范围地图格式,
坐标(或 9)= 表格格式的坐标,
SAMPE = SAM 格式(在标志中设置 paired_read 位),
samse = SAM 格式(不设置 paired_read 位)

输出选项

-n, --n路径=INT
要显示的最大路径数(默认为 5)。 如果设置为 1,GMAP 将不会报告
嵌合比对,因为这意味着两条路径。 如果你想要一个单一的对齐方式
加上嵌合比对,然后将其设置为 0。

--次优得分=INT
仅报告得分在最佳路径的此值内的路径。 默认情况下,
如果未提供此选项,
该程序打印找到的所有路径。

-O, --有序
以与输入相同的顺序打印输出(仅当有多个工人时才相关)
线程)

-5, --md5
为每个查询序列打印 MD5 校验和

-o, --嵌合体重叠
重叠以在嵌合体断点处显示(如果有)

--failonly
只打印失败的对齐,那些没有结果的对齐

--无故障
排除打印失败的对齐

-V, --snps目录=STRING
SNP 索引文件的目录(使用 snpindex 创建)(默认为
使用指定的基因组索引文件 -D-d)

-v, --使用-snps=STRING
使用包含已知 SNP 的数据库(在.iit,以前使用
snpindex) 用于对 SNP 的耐受性

--分割输出=STRING
多文件输出的基名,分别用于 nomapping,
uniq、mult(和嵌合体,如果 --嵌合边距 被选中)

--失败输入=STRING
将完全失败的对齐作为输入 FASTA 或 FASTQ 格式打印到给定的
文件。 如果 --分割输出 还给出了标志,另外生成了这个文件
到 .nomapping 文件中的输出。

--附加输出
什么时候 --分割输出 or --失败输入 给出,此标志会将输出附加到
现有文件。 否则,默认是创建新文件。

--输出缓冲区大小=INT
查询中的缓冲区大小,用于输出线程(默认为 1000)。 当数
要打印的结果超过此大小,工作线程将暂停,直到
积压被清除

-F, - 全长
假设全长蛋白质,从 Met 开始

-a, --cdsstart=INT
从给定的核苷酸翻译密码子(基于 1)

-T, - 截短
围绕全长蛋白质截断对齐,Met to Stop 意味着 -F 旗。

-Y, - 宽容
翻译具有移码校正的 cDNA

GFF3 输出选项

--gff3-添加分隔符=INT
是否在每个查询序列后添加### 分隔符值:0(否),1(是,
默认)

SAM 输出选项

--无 sam 标头
不要打印以“@”开头的标题

--sam-使用-​​0M
在 CIGAR 中相邻的插入和删除之间插入 0M 皮卡德要求,
但可能会导致其他工具出错

--force-xs-目录
对于 RNA-Seq 比对,不允许 XS:A:? 当感觉方向不清楚时,和
用 XS:A:+ 任意替换此值。 可能对某些程序有用,例如
作为袖扣,无法处理 XS:A:?。 但是,如果您使用此标志,则
在这些情况下 XS:A:+ 的报告值将没有意义。

--md-小写-snp
在 MD 字符串中,当已知 SNP 由 -v 旗,
将不同的核苷酸打印为小写,当它们,
与参考不同但匹配已知的替代等位基因

--action-if-cigar-错误
如果 CIGAR 长度和序列长度不一致时采取的措施
允许值:忽略、警告(默认)、中止

--读取组ID=STRING
要放入读取组 ID (RG-ID) 字段的值

--读取组名称=STRING
要放入读取组名称 (RG-SM) 字段的值

--读取组库=STRING
放入读取组库 (RG-LB) 字段的值

--读取组平台=STRING
放入读取组库 (RG-PL) 字段的值

质量分数选项

--质量协议=STRING
输入质量分数协议。 允许值:照度(ASCII 64-126)
(相当于 -J 64 -j -31) sanger (ASCII 33-126)(相当于 -J 33 -j 0)

默认为 sanger(无质量打印偏移)
SAM 输出文件应在桑格协议中具有质量分数

或者您可以使用此标志指定打印班次:

-j, --质量打印转移=INT
将 FASTQ 质量分数在输出中按此数量移动(sanger 的默认值为 0
协议; 要将 Illumina 输入更改为 Sanger 输出,请选择 -31)

外部地图文件选项

-M, --映射目录=目录
地图目录

-m, - 地图=文件
地图文件。 如果参数是 '?' (带引号),
这列出了可用的地图文件。

-e, --地图外显子
分别映射每个外显子

-b, --mapboth
报告来自基因组两条链的命中

-u, --侧翼=INT
显示侧翼命中(默认 0)

--打印评论
为每个点击显示评论行

对齐输出选项

-N, --无长度
没有对齐的内含子长度

-I, --反转模式=INT
与基因组 (-) 链的比对模式:0=不反转 cDNA(默认)
1=反转 cDNA 并打印基因组 (-) 链 2=反转 cDNA 并打印基因组 (+)


-i, --intronap=INT
在内含子两端显示的核苷酸(默认为 3)

-l, --包裹长度=INT
对齐的环绕长度(默认 50)

过滤输出选项

--最小修剪覆盖范围=FLOAT
不要打印修剪覆盖率小于此值的对齐(默认值 = 0.0,即
意味着没有过滤)请注意,无论这如何,都会输出嵌合比对
过滤

--最小身份=FLOAT
不打印标识小于此值的对齐(默认值 = 0.0,这意味着没有
过滤)请注意,无论此过滤器如何,都会输出嵌合比对
帮助选项

- 查看
检查编译器假设

- 版
显示版本

- 帮帮我 显示此帮助消息

GMAP套件的其他工具位于/usr/lib/gmap

使用 onworks.net 服务在线使用 gmap


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad


输入