这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令争夺,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
争夺 - 在 SAM、BAM 和 CRAM 文件格式之间转换。
概要
争夺 [选项[输入文件 [输出文件]]
商品描述
争夺 在各种下一代测序比对文件格式之间进行转换,包括
SAM、BAM 和 CRAM。 它既可以充当读取标准输入和写入标准输出的管道,也可以作为
命名文件。
当作为管道操作时,输入类型默认为 SAM 或 BAM,需要 -I 填满
指示输入为 CRAM 格式的选项是合适的。 输出默认为 BAM,但
可以使用 -O 格式 选项。 当给定文件名时,文件类型为
根据文件名后缀自动选择。
配置
-I 格式
选择输入格式,其中 格式 是 sam、bam 或 cram 之一。 使用这个时
通过管道读取以避免在尝试检测时消耗输入字节
输入为 SAM 或 BAM 格式。
-O 格式
选择输出格式,其中 格式 是 sam、bam 或 cram 之一。
-1 至 -9
将压缩级别设置为从 1(低压缩、快速)到 9(高压缩、
慢)以 BAM 或 CRAM 格式写入时。 这仅在写作期间使用。
-0 or -u
写入未压缩的数据。 在 BAM 中,这仍然使用 BGZF 容器,但没有
内部压缩。 在 CRAM 中,它以 RAW 格式存储块。 选项
对 SAM 输出没有影响。
-j 仅 CRAM 编码。 将 bzip2 添加到可能使用的压缩代码列表中
在 CRAM 创建期间。
-Z 仅 CRAM 编码。 将 lzma 添加到可能使用的压缩代码列表中
在 CRAM 创建期间。 鉴于lzma的压缩速度慢,这可能只是
用于比 zlib 或 bzip2 具有显着优势的地方,但具有更高的
压缩级别 (-7) 此权重被忽略,因为 LZMA 解压缩速度为
可以接受,尽管仍然比 zlib 慢。
-m 仅限 CRAM 解码。 生成 MD:Z: 和 NM:I: 辅助字段
基于参考的压缩。
-M 仅 CRAM 编码。 将来自多个引用的序列强行打包到同一个
片。 通常,当从一个引用更改为
另一个,但仍会自动切换到多参考切片,如果
每个切片的序列数变得太小。
-R 范围
目前仅用于 CRAM 输入,但 SAM/BAM 支持正在等待中。 这表明一个
参考序列名称和可选的开始和结束位置
参考,使用语法 参考名称 or 参考名称:开始- end. 为了高效运行
CRAM 文件需要一个 .crai 格式索引(使用 补习索引 程序)。
-r 参考文献
仅 CRAM 编码。 使用它来指定参考 fasta 文件。 请注意,如果
输入 SAM 或 BAM 文件 a 文件: 或基于本地文件系统的 URI 中指定的
@SQ 标头则可能不需要此选项。
-s 数
仅 CRAM 编码。 指定每个切片的序列数。 默认为
10000.
-S 数
仅 CRAM 编码。 指定每个容器的切片数。 默认为 1。
-t 仅限 BAM 和 CRAM。 指定压缩或解压缩线程的数量,
在编码和解码之间自适应共享。 默认为 1(无
穿线)。
-V 版本字符串
仅 CRAM 编码。 设置 CRAM 文件格式版本。 支持的值为“2.0”,
“2.1”和“3.0”。
-e 仅 CRAM 编码。 在每个切片中嵌入参考序列的片段。 这个
意味着无需指定参考 fasta 文件即可解码文件。
-x 仅 CRAM 编码。 省略基于引用的压缩,而是存储
每一个基本的逐字逐句。
-B 实验性的,仅编码。 存储质量值时,bin 为 8 个离散的
值(加 0),通常由现代 Illumina 仪器使用。 (请注意,
bin 可能不是完全相同的范围。)
-! 仅限 CRAM v3.0 及以上解码。 不检查 CRC。 这个选项应该只
在尝试从数据损坏中恢复时使用。
示例
使用参考 MT.fa 将 BAM 文件从标准输入转换为标准输出上的 CRAM。
一些命令 | 争夺 -I bam -O cram -r MT.fa | 一些命令
默认的 CRAM 输出格式为 3.0 版,因此在执行时无需指定版本
从 2.1 转换为 3.0。 要执行反向使用:
争夺 -V 2.1 in.cram out.cram
使用 onworks.net 服务在线使用 scramble