これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド kmer-mask です。
プログラム:
NAME
kmer-mask - kmer コンテンツによるヌクレオチド配列セットのマスクとフィルター
SYNOPSIS
kmerマスク {-小説|-確認済み} [-mdb マーデータベース] [-MS マーサイズ] [-edb 存在するデータベース] [-m
最小サイズ] [-e 拡張サイズ] [-低閾値 l] [-高しきい値 h] [-t スレッド] [-v] [-h
ヒストグラム] [-促進|-降格|-破棄] -1 in.1.fastq [-2 in.2.fastq] -o 出力プレフィックス
DESCRIPTION
kmer コンテンツによってシーケンス (読み取りであると推定される) セットをマスクおよびフィルターします。 マスキングは可能です
データベースにない新規配列を保持するため、または存在する確認された配列を保持するために行われます。
データベース内で。 フィルタリングにより、シーケンスが完全に、部分的に、またはマスクされずに分離されます。
OPTIONS
-mdb マーデータベース
マスキング kmers をロードします メリル(1) マーデータベース
-MS マーサイズ
-edb 存在するデータベース
マスキング kmers を 存在DB(1)ファイル 存在するデータベース 再起動を高速化するために
-1 in.1.fastq
-2 in.2.fastq
input は、fastq、fastq.gz、fastq.bz2、または fastq.xz 形式のファイルを読み取ります。 XNUMXつ目は
オプションですが、存在しない場合は出力分類が混乱します。
-o でる
出力読み取りのプレフィックス
でる.fullmasked.[12].fastq
「低閾値」未満の塩基が保持された読み取り
でる.partiallymasked.[12].fastq
途中で読む
でる.retained.[12].fastq
「hightreshold」を超える塩基が保持された読み取り
でる.discarded.[12].fastq
競合するステータスの読み取り
-m 最小サイズ
この数の連続 kmer 未満のデータベース ヒットを無視します (0)
-e 拡張サイズ
この多数の欠落 kmer にわたってデータベース ヒットを拡張します (0)
-小説 RETAIN 新規シーケンスがデータベースに存在しません
-確認済み
RETAIN データベース内に存在する確認済みシーケンス
-促進
より低い RETAINED 読み取りを、より高い RETAINED 読み取りのステータスに昇格します。
read1=完全にマスクされ、read2=部分的にマスク -> 両方とも部分的にマスクされます
-降格
より多くの RETAINED 読み取りを、より少ない RETAINED 読み取りのステータスに降格します。
read1=完全にマスクされ、read2=部分的にマスクされる -> 両方とも完全にマスクされる
-破棄
ステータスが競合するペアを破棄 (デフォルト) read1=完全にマスクされ、
read2=部分的にマスク -> 両方とも破棄されます
統計情報 on 標準エラー、 数 of シーケンス 量 保持:
-低閾値 t
(0.3333)
-高しきい値 t
(0.6667)
-h ヒストグラム
RETAINED シーケンスの量のヒストグラムを書き込みます
-t t つかいます t 計算スレッド
-v 進捗状況を表示
onworks.net サービスを使用してオンラインで kmer-mask を使用する