这是 meryl 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
meryl - 核内和核外 kmer 计数和实用程序
概要
估算 记忆
梅丽尔 -P -m 公里数 [-c #[-p] -s seq.fasta
梅丽尔 -P -m 公里数 [-c #[-p] -n 默数
建筑物 a 表
梅丽尔 -B -m 公里数 [-c #[-p[-v[-f|-r|-C[-L 小事[-U 最大出现次数]
[-线程 n | {-段 中模板 | -记忆 兆字节} [-configbatch [-sge 职位名称]]]
-s seq.fasta -o 前缀
梅丽尔 -计数批次 数 [-sgebuild "q子选项字符串"] -o 前缀
梅丽尔 -合并批处理 数 [-合并 "q子选项字符串"] -o 前缀
表演 操作 on a 表
梅丽尔 -M 操作 [-v] -s 前缀 [-s 表前缀2 ...] -o 产量
倾倒 a 表
梅丽尔 -Dh -s 前缀
梅丽尔 -DT -n 最小计数 -s 前缀
商品描述
梅丽尔 计算基因组序列的 kmer 含量。 Kmer 内容表示为
kmers 列表以及每个在输入序列中出现的次数。 kmer 可以是
仅限于前向 kmer、仅反向 kmer 或规范 kmer
(每个位置的正向和反向 kmer 的字典序较小)。 梅丽尔 能够
报告计数的直方图、kmers 列表及其计数,或者可以执行
对处理过的数据文件进行数学运算和设置运算。
输出 梅丽尔 是两个二进制文件,称为meryl数据库,可以快速
转储以提供计数的直方图或实际计数。 提供了一个 C++ 库
用于直接访问文件。
配置
-P 估计内存需求。 给定一个序列文件(-s) 或上限
文件中的mers数(-n), 计算表大小 (-t 在构建中)以最小化
内存使用情况。 此模式识别以下选项:
-m # mer的大小(必填)
-c # 均聚物压缩(可选)
-p 启用职位
-s seq.fasta
要扫描的序列文件以确定 mers 的数量
-n # 假设文件中包含这么多 mers 来计算参数
只有其中之一 -s, -n 需要指定。 如果两者都给出, -s 优先。
-B 计算给定序列文件的 mer-count 表 (-s) 和许多参数。 经过
默认情况下,两条链都被处理。
-f 只为前向链构建
-r 只为反向链构建
-C 使用规范mers(假设两条链)
-L # 不要保存出现少于 # 次的 mers
-U # 不要保存出现超过 # 次的 mers
-m # mer的大小(必填)
-c # 均聚物压缩(可选)
-p 启用职位
-s seq.fasta
建立表格的顺序
-o 前缀
输出表前缀
-v 娱乐用户
梅丽尔 进程可以在一个大内存批次中运行,在许多小内存批次中运行,
或在 SGE 控制下,所有使用或不使用多个 CPU 内核。 默认情况下,
计算是作为一个大型顺序过程完成的。 多线程操作
是可能的,需要额外的内存开销,就像分段操作一样,需要额外的
输入/输出费用。
螺纹的 操作
将计数分成 n 个几乎相同大小的块。 这使用了额外的
h MB(来自 -P) 每个线程。
-线程 n
使用 n 要构建的线程
分段, 顺序 操作
将计数分成不超过 m MB 的部分
内存,或分成 n 个相同大小的块。 每一块都是按顺序计算的,
并在最后合并结果。 只有其中之一 -记忆 和 -段 is
需要。
-记忆 m
最多使用 m 每段 MB 内存
-段 n
使用 n 中模板
分段, 分批 操作
与顺序相同,除了这允许手动执行每个段
在平行下。 只有其中之一 -记忆 和 -段 需要。 另见
例 此页面上的部分。
-记忆 m
最多使用 m 每段 MB 内存
-段 n
使用 n 中模板
-configbatch
创建批次
-计数批次 n
运行批号 n
-合并批处理
合并批次
批处理模式可以在网格上运行。
-sge 职位名称
此执行的唯一作业名称。 梅丽尔 将提交带有名称的作业
mp职位名称, 数控职位名称, 纳米职位名称, 用于阶段准备、计数和合并。
-sgebuild “选项”
-合并 “选项”
任何其他选项 qsub(1)(例如,“-p -153 -pe 线程2 -A
merylaccount") 注意- -N 将被忽略 注意 - 请务必引用
选项
-M 给定一个表格列表,执行数学、逻辑或阈值运算。 除非
指定,所有操作都使用任意数量的数据库。 数学运算是:
分钟 count 是所有数据库的最小计数。 如果 mer 不存在于
所有数据库中,mer 的计数为零,并且不在输出中。
存在
count 是包含 mer 的所有数据库的最小计数
最大 count 是所有数据库的最大计数
加 count 是所有数据库的计数总和
分 计数是第一个减去第二个(仅限二进制)
ABS count 是第一个的绝对值减去第二个(仅限二进制)
逻辑操作是:
和 如果它存在于所有数据库中,则输出 mer
NAND 输出 mer 如果它存在于至少一个但不是所有数据库中
or 如果它存在于至少一个数据库中,则输出 mer
XOR 如果它存在于奇数个数据库中,则输出 mer
阈值操作是:
少于 x
输出 mer 如果它有 count < x
小于等于 x
输出 mer 如果它有 count <= x
比...更棒 x
输出 mer 如果它有计数 > x
大于或等于 x
输出 mer 如果它有计数 >= x
等于 x
输出 mer 如果它有 count == x
阈值操作仅适用于一个数据库。
-s 前缀
使用 前缀 作为数据库
-o 前缀
创建此输出
-v 娱乐用户
-D 转储表(并非所有这些工作)
-dd 转储相同mers之间距离的直方图。
-DT 转储 mers >= 阈值。 用 -n 来指定阈值。
-DC 计算mers、distinct mers和unique mers的数量。
-Dh 转储(到标准输出)mer 计数的直方图。
-s 从这里阅读计数表(去掉 .mcdat 或 .mcidx)。
例
批量 创建 of a 表
初始化计算 -configbatch,它需要所有的构建选项。 全部执行
-计数批次 工作,然后 -合并批处理 来完成。
梅丽尔 -configbatch -B [选项] -o 文件
梅丽尔 -计数批次 0 -o 文件
梅丽尔 -计数批次 1 -o 文件
...
梅丽尔 -计数批次 N -o 文件
梅丽尔 -合并批处理 N -o 文件
使用 onworks.net 服务在线使用 meryl