这是 sam-stats 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
sam-stats - ea-utils:生成摘要统计信息
概要
山姆统计 [选项[file1[file2...文件]
商品描述
版本:1.38.681
为列出的文件生成大量易于消化的统计信息
选项(括号中的默认值):
-D 跟踪多个对齐 -O PREFIX 输出前缀启用
扩展输出(见下文) -R FIL 覆盖率/RNA 输出(覆盖率、3' 偏差等,
暗示 -A) -A 报告所有 chr sig,即使超过 1000 -b INT
为每个碱基统计数据采样的读取数 (1M) -S INT ASCII 签名的大小
(30) -x 用于处理多个文件的 FIL 文件扩展名(统计信息) -M 只有
如果更新则覆盖(需要 -x,或多个文件) -B 输入是bam,不要
麻烦看魔术 -z 当 sam 中的条目为零时不要失败
输出:
如果指定了一个文件,则输出为标准输出。 如果多个文件
指定,或者如果 -x 提供了选项,输出文件是. . 默认
扩展名是“统计”。
完整统计:
:平均值、最大值、标准差、中位数、Q1(25 个百分位数)、Q3
读取:sam 文件中的条目数,可能不是 # 读取
phred : 使用的phred比例
bsize : # 用于 qual stats 的读取
映射读取
:对齐读取的数量(唯一的探针 ID 序列)
映射碱基
:对齐读取的总长度
前锋
:前向对齐读取的数量
反转
:反向对齐读取的数量
snp率
:不匹配的碱基/总碱基(snv率)
插入率
:插入碱基/总碱基
删除率
: 删除碱基/总碱基
百分比不匹配
:不匹配的读取百分比
对齐
:对齐的读取百分比
连
: 读取长度统计信息,如果是固定长度则忽略
地图
:映射质量的统计数据
插入
: 插入尺寸的统计数据
% : 每个 chr 映射碱基的百分比,后跟一个签名
二次抽样 统计 (1M 读 最大限度):
基本质量: 基础质量的统计数据 %A,%T,%C,%G : 基础百分比
意 of 这些因素包括原料奶的可用性以及达到必要粉末质量水平所需的工艺。 每染色体 签名:
按染色体位置映射读取的 ascii 直方图。 只有当
原始 SAM/BAM 有一个标题。 这些值是映射读取数的 log2
每个位置+ ascii '0'。
扩展 产量 模式 产生 a 集 of 文件:
.stats : 主要输出
.fastx : fastx-toolkit 兼容输出
.rcov : 每个引用计数和覆盖率
.xdist : 不匹配分布
.ldist :长度分布(如果适用)
.mqdist
: 映射质量分布
使用 onworks.net 服务在线使用 sam-stats