mhap - 云端在线

这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令 mhap,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


mhap - 概率序列重叠

商品描述


请设置 -s 或者 -p 选项。 请参阅以下选项: MHAP:MinHash 对齐协议。
一种用于查找长读序列(如 PacBio 或 Nanopore)重叠的工具
生物信息学。

版本:1.6,构建时间:09/12/2015 11:46 PM 用法 1(直接执行):java
-服务器 -Xmx -罐 -s[-q
文件>] [-f ] 用法 2(生成预先计算的
二进制文件):java -服务器 -Xmx -罐 -p
-q [-F ]

- 结盟, 默认 = 假
实验选项。

--对齐偏移, 默认 = -0.535
用于说明对齐匹配分数差异的偏移量。

--对齐分数, 默认 = 1.0E-6
对齐匹配的截止分数。

--过滤器阈值, 默认 = 1.0E-5
[double],k-mer过滤文件中k-mer被考虑的截止点
重复。 特定 k-mer 的此值在中的第二列中指定
过滤器文件。 如果未提供过滤器文件,则忽略此选项。

- 帮帮我, 默认 = 假
显示帮助菜单。

--最大移位, 默认值 = 0.2
[double],估计重叠左侧和右侧的区域大​​小,如导出
来自中值偏移和序列长度,其中 k-mer 匹配仍然是
认为有效。 仅二级过滤器。

--最小存储长度, 默认值 = 0
[int],存储在框中的读取的最小长度。 用来过滤
从 FASTA 文件中短读。

--纳米孔快速, 默认 = 假
设置纳米孔快速设置的所有参数。 这是目前最好的
指导,并且可以在没有警告的情况下随时更改。

--无我, 默认 = 假
不要计算框内序列之间的重叠。 应在使用时
to 和 from 序列来自不同的文件。

--num-hashs, 默认值 = 512
[int],在 MinHashing 中使用的 min-mers 的数量。

--最少匹配数, 默认值 = 3
[int], minimum # min-mer 在计算第二阶段过滤器之前必须共享。
低于该值的任何序列都被认为是非重叠的。

--线程数, 默认值 = 12
[int],用于计算的线程数。 通常设置为 2 x #cores。

--pacbio-fast, 默认 = 假
设置 PacBio 快速设置的所有参数。 这是目前最好的
指导,并且可以在没有警告的情况下随时更改。

--pacbio敏感, 默认 = 假
设置 PacBio 敏感设置的所有参数。 这是目前最好的
指导,并且可以在没有警告的情况下随时更改。

--存储完整 ID, 默认 = 假
存储在 FASTA 文件中看到的完整 ID,而不是只存储序列
文件中的位置。 一些 FASTA 文件的 IDS 很长,这会减慢结果的输出。
使用压缩文件格式时将忽略此选项。

- 临界点, 默认值 = 0.04
[double],第二阶段sort-merge的阈值相似度得分截止
筛选。 这是基于重叠中k-mers匹配的平均数
地区。

- 版, 默认 = 假
显示版本和构建时间。

--加权, 默认 = 假
执行加权 MinHashing。

-f, 默认 = ""
k-mer 过滤器文件,用于过滤掉高度重复的 k-mer。 必须排序
按频率降序排列(第二列)。

-h, 默认 = 假
显示帮助菜单。

-k, 默认值 = 16
[int],用于 MinHashing 的 k-mer 大小。 第二级过滤器的 k-mer 大小为
分开,不能修改。

-p, 默认 = ""
仅使用 2。 包含应转换为的 FASTA 文件的目录
用于存储的二进制格式。

-q, 默认 = ""
用法 1:读取的 FASTA 文件或文件目录,将与
框中的读数集(见 -s)。 用法 2:二进制文件的输出目录
格式化的 dat 文件。

-s, 默认 = ""
仅使用 1。 将被读取的 FASTA 或二进制 dat 文件(参见用法 2)
存储在一个盒子中,并且所有后续读取都将与之进行比较。

使用 onworks.net 服务在线使用 mhap



最新的 Linux 和 Windows 在线程序