英语法语西班牙语

Ad


OnWorks 网站图标

小地图 - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行小地图

这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令小地图,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


minimap - 长 DNA 序列之间的快速映射

概要


小地图 [-lSOV[-k er[-w 大小[-I 批量大小[-d 转储文件[-f ocThres[-r
带宽[-m 最小共享[-c 最小计数[-L 最小匹配[-g 最大间隙[-T 灰尘阈值[-t
线程数[-x 预设] 目标文件 查询.fa > 输出文件

商品描述


Minimap 是一种有效地找到两个之间的多个近似映射位置的工具
长序列集,例如读取和参考基因组之间,基因组和
在长时间嘈杂的阅读之间。 Minimap 有一个索引和一个映射阶段。 在索引中
阶段,它将大量目标序列的所有最小值收集到一个哈希表中; 在
在映射阶段,它识别出共线最小化命中的良好集群。 小地图可以
不生成目标和查询序列之间的详细比对。 它只是
输出这些簇的近似起点和终点坐标。

配置


索引 选项
-k INT 最小化 k-mer 长度 [15]

-w INT 最小化窗口大小 [k-mer 长度的 2/3]。 最小化器是最小的 k-mer
在 w 个连续 k-mers 的窗口中。

-I 最多加载 目标碱基进入 RAM 以进行索引 [4G]。 如果有超过
目标文件, 小地图需要阅读 查询.fa 多次映射它
针对每批目标序列。 可能以 k/K/m/M/g/G 结尾。

-d 文件 转储最小化索引到 文件 [没有转储]

-l 表明 目标文件 实际上是由选项生成的最小化索引 -d,不
FASTA 或 FASTQ 文件。

地图绘制 选项
-f FLOAT 忽略顶部 FLOAT 大多数出现的极小值的比例 [0.001]

-r INT 初始最小化命中聚类的近似带宽 [500]。 一种 最小化器
击中 是目标序列和查询序列中都存在的最小化器。 一种 最小化器
击中 是目标之间的一组潜在共线的极小点
和查询序列。

-m FLOAT 合并初始最小化命中簇,如果 FLOAT 或更高比例的极小值
在集群之间共享 [0.5]

-c INT 如果包含最小化命中簇,则保留它 INT 或更多的最小化命中 [4]

-L INT 如果在共线性化后,匹配的数量
基地在下面 INT [40]。 此选项主要减少输出的大小。 它有
对速度和峰值内存影响不大。

-g INT 在间隙处拆分最小化命中簇 INT-bp 或更长的不包含
任何最小化命中 [10000]

-T INT 使用 SDUST 分数阈值屏蔽查询序列上的区域 INT; 0 禁用
[0]。 SDUST 是一种识别低复杂度子序列的算法。 它不是
默认启用。 如果首选 SDUST,则 20 到 25 之间的值是
受到推崇的。 较高的阈值掩盖较少的序列。

-S 执行全对全映射。 在这种模式下,如果查询序列名称是
字典序大于目标序列名称,它们之间的命中
会被压制; 如果查询序列名称与目标名称相同,
对角最小化命中也将被抑制。

-O 如果它远离其他命中(实验),则丢弃最小命中。 这个
选项可用于绘制来自两个不同物种的长染色体。

-x STR 更改多个设置基于 STR [没有设置]。 建议申请
此选项在其他选项之前,以便以下选项可能会覆盖
此选项修改的多个设置。

阿瓦10k 用于 PacBio 或 Oxford Nanopore all-vs-all read mapping (-Sw5 -L100 -m0)。

输入输出 选项
-t INT 线程数 [3]。 小地图收集时最多使用三个线程
目标序列上的最小化器,最多使用 INT映射时 +1 个线程(
额外的线程用于 I/O,它经常空闲并且占用很少的 CPU 时间)。

-V 将版本号打印到标准输出

OUTPUT FORMAT


小地图以成对映射格式 (PAF) 输出映射位置。 PAF 是一个 TAB-
分隔的文本格式,每行至少包含 12 个字段,如中所述
下表:

┌────┬──────────┬───────────────────────────────────── ────────────────────────────┐
关口Type产品描述
├────┼────────┼────────────────────────────────────── ────────────────────────────┤
│ 1 │ 字符串 │ 查询序列名称 │
│ 2 │ int │ 查询序列长度│
│ 3 │ int │ 查询起始坐标(从0开始)│
│ 4 │ int │ 查询终点坐标(从0开始)│
│ 5 │ char │ `+' 如果查询和目标在同一条链上; `-'如果相反│
│ 6 │ 字符串 │ 目标序列名称 │
│ 7 │ int │ 目标序列长度│
│ 8 │ int │ 原始链上的目标起始坐标│
│ 9 │ int │ 原始链上的目标终点坐标│
│ 10 │ int │ 映射中匹配碱基的数量 │
│ 11 │ int │ 映射中的基数,包括间隙 │
│ 12 │ int │ 映射质量(0-255,缺失为255)│
└────┴────────┴──────────────────────────────────── ────────────────────────────┘

当比对可用时,第 11 列给出序列匹配的总数,
比对中的不匹配和缺口; 第 10 列除以第 11 列给出对齐
身份。 由于 minimap 不会生成详细的对齐方式,因此这两列是
近似。 PAF 可以选择在类似 SAM 的类型键值中包含其他字段
格式。 Minimap 将集群中的最小化命中数写入 cm 标记。

使用 onworks.net 服务在线使用小地图


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad