これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド Cutadapt です。
プログラム:
NAME
Cutadapt - Cutadapt 1.8.3 のマニュアル ページ
DESCRIPTION
Cutadapt バージョン 1.8.3 著作権 © 2010-2015 Marcel Martin[メール保護]>
Cutadapt は、ハイスループット シーケンシング リードからアダプター シーケンスを削除します。
使用法:
カットアダプト -a ADAPTER [オプション] [-o Output.fastq] input.fastq
ペアエンド 読み取ります。
カットアダプト -a ADAPT1 -A ADAPT2 [オプション] -o out1.fastq -p out2.fastq in1.fastq
in2.fastq
「ADAPTER」を 3' アダプターの実際のシーケンスに置き換えます。 IUPAC ワイルドカード文字
サポートされています。 逆の補数は自動的には検索されません。 すべての読み取り元
input.fastq は、アダプター シーケンスが削除された状態で、output.fastq に書き込まれます。 アダプタ
マッチングはエラーを許容します。 複数のアダプター シーケンスを指定できます (さらに使用します) -a
オプション)、最も一致するアダプターのみが削除されます。
入力は FASTA 形式である場合もあります。 圧縮された入出力がサポートされており、
ファイル名(.gz、.xz、.bz2)から自動検出されます。 標準のファイル名「-」を使用します。
入出力。 なしで -o オプションを指定すると、出力は標準出力に送信されます。
一部 その他 利用できます 機能を使用 には次の値があります:
* 他のさまざまなアダプター タイプ (5 フィート アダプター、「混合」5 フィート/3 フィート アダプターなど) *
固定数のベースのトリミング * 高品質のトリミング * カラースペース読み取りのトリミング *
さまざまな基準による読み取りのフィルタリング
「カットアダプト」を使用します。 - 助けてすべてのコマンドライン オプションを表示するには、「」を参照してください。
http://cutadapt.readthedocs.org/ 完全なドキュメントについては。
OPTIONS
- バージョン
プログラムのバージョン番号を表示して終了します
-h, - 助けて
このヘルプメッセージを表示して終了します
-f フォーマット、 - フォーマット=FORMAT
入力ファイル形式。 「fasta」、「fastq」、「sra-fastq」のいずれかです。 無視される場合
csfasta/qual ファイルの読み取り (デフォルト: ファイル名拡張子から自動検出)。
アダプターの検索方法に影響するオプション:
次の XNUMX つのパラメータのそれぞれ (-a, -b, -g) は複数回使用でき、
任意の組み合わせで、異なる可能性のあるアダプターのセット全体を検索します。
種類。 最も一致するアダプターのみが各読み取りからトリミングされます (ただし、
-回 オプション)。 アダプターを直接与える代わりに、次のように書くこともできます。
file:FILE と指定された FILE からアダプター シーケンスが読み取られます (ファイルは
FASTA 形式で)。
-a アダプタ、 - アダプタ=アダプタ
3' 末端に連結されたアダプターの配列。 アダプター自体と、
その後に続くものはすべて切り取られます。 アダプターシーケンスが「$」で終わる場合
文字の場合、アダプタは読み取りの最後に固定され、それが文字である場合にのみ検出されます。
読み取りのサフィックス。
-g アダプタ、 - 正面=アダプタ
5' 末端に連結されたアダプターの配列。 アダプターシーケンスの場合
文字「^」で始まる場合、アダプタは「アンカー」されます。 アンカーアダプターは、
リードの 5' 末端にその全体が現れます (リードのプレフィックスです)。 あ
アンカーされていないアダプターは部分的に 5' 末端に出現することもあれば、XNUMX' 末端内に出現することもあります。
読む。 リード内で見つかった場合は、アダプターの前のシーケンスも検出されます。
トリミングされた。 いずれの場合も、アダプター自体はトリミングされます。
-b アダプタ、 - どこでも=アダプタ
5' または 3' 末端に連結されたアダプターの配列。 アダプターが
リード内で見つかった場合、またはリードの 3' 末端と重複している場合、その動作は次のとおりです。
と同じように -a オプション。 アダプターが 5' 末端 (最初の部分) に重なっている場合は、
read)、アダプターに一致する読み取りの最初の部分はトリミングされますが、
その後に続くものはすべて保持されます。
-e ERROR_RATE、 --エラー率=ERROR_RATE
最大許容エラー率 (エラー数をマッチングの長さで割った値)
地域) (デフォルト: 0.1)
--インデルなし
アライメント内でインデルを許可しないでください (不一致のみを許可します)。 現在のみ
アンカーアダプターでサポートされています。 (デフォルト: 不一致とインデルの両方を許可します)
-n カウント、 -回=COUNT
アダプターの取り外しは最大 COUNT 回試行してください。 アダプターが追加される場合に便利です
複数回 (デフォルト: 1)。
-O 長さ、 --オーバーラップ=LENGTH
最小オーバーラップ長さ。 リードとアダプター間のオーバーラップが短い場合
LENGTH よりも大きい場合、読み取り値は変更されません。 これにより、ノーが減少します。 純粋にトリミングされたベースの
ランダムなアダプターの一致が短いためです (デフォルト: 3)。
--match-read-wildcards
読み取り時に IUPAC ワイルドカードを許可します (デフォルト: False)。
-N, --no-match-adapter-wildcards
アダプター内の IUPAC ワイルドカードを解釈しないでください。
処理された読み取りのフィルタリングのオプション:
--破棄トリミング, - 破棄
アダプターを含む読み取りをトリミングする代わりに破棄します。 も使用します -O in
ランダムに一致する読み取りを大量に破棄しないようにするためです。
--破棄-トリミングされていない, --トリミングのみ
アダプターを含まない読み取りを破棄します。
-m 長さ、 --最小長=LENGTH
LENGTH より短いトリミングされた読み取りを破棄します。 短すぎる読み取りでも
アダプターを取り外す前のものも破棄されます。 カラースペースでは、初期プライマーは
カウントされます (デフォルト: 0)。
-M 長さ、 --最大長=LENGTH
LENGTH より長いトリミングされた読み取りを破棄します。 長すぎる読み取りでも
アダプターを取り外す前のものも破棄されます。 カラースペースでは、初期プライマーは
カウントされます (デフォルト: 制限なし)。
--トリムなし
通常どおり、読み取りを照合して出力/非トリム出力にリダイレクトしますが、削除はしません
アダプター。
--最大n=LENGTH
読み取りで許可される N の最大割合。 1 未満の数値は次のように扱われます。
比率。数値 > 1 は N の最大数として扱われます。
含まれています。
--マスクアダプター
アダプターをトリミングせずに「N」文字でマスクします。
何をどこに出力するかに影響を与えるオプション:
- 静かな
最後にレポートを印刷しないでください。
-o ファイル、 - 出力=FILE
変更された読み取りを FILE に書き込みます。 入力に応じて FASTQ または FASTA 形式が選択されます。
概要レポートは標準出力に送信されます。 逆多重化するには FILE で '{name}' を使用してください
複数のファイルを読み込みます。 (デフォルト: トリミングされた読み取りは標準出力に書き込まれます)
--情報ファイル=FILE
各読み取りとそのアダプターの一致に関する情報を FILE に書き込みます。 を参照してください。
ファイル形式に関するドキュメント。
-r ファイル、 --残りファイル=FILE
アダプターが読み取りの途中で一致した場合、残りを書き込みます (
アダプター)をファイルに保存します。
--ワイルドカードファイル=FILE
アダプターにワイルドカード ベース (「N」) がある場合、ワイルドカードに一致するアダプター ベースを書き込みます
ファイルへの位置を指定します。 アライメントにインデルがある場合、これは多くの場合そうではありません。
正確。
--短すぎる出力=FILE
短すぎる書き込み読み取り (指定された長さに従って) -m) ファイルへ。
(デフォルト: 読み取りを破棄)
--長すぎる出力=FILE
長すぎる書き込み読み取り (指定された長さに従って) -M) ファイルへ。
(デフォルト: 読み取りを破棄)
--トリミングされていない出力=FILE
アダプターを含まない読み取りを FILE に書き込みます。 (デフォルト: 同じファイルに出力
トリミングされたとおり)
読み取りに対する追加の変更:
-u 長さ、 - 切る=LENGTH
各読み取りの先頭または末尾から LENGTH 塩基を削除します。 LENGTH が正の場合、
塩基は各読み取りの先頭から削除されます。 LENGTH が負の場合、
塩基は各読み取りの終わりから削除されます。 このオプションは次の場合に XNUMX 回指定できます。
LENGTH には異なる符号があります。
-q [5'カットオフ、]3'カットオフ、 --品質カットオフ=[5'カットオフ、]3'カットオフ
アダプターを取り外す前に、リードの 5' および/または 3' 端から低品質の塩基をトリミングします。 もしも
3 つの値が指定されている場合、XNUMX' 末端のみがトリミングされます。 XNUMX つのカンマ区切りのカットオフがある場合、
与えられた場合、5' 末端は最初のカットオフでトリミングされ、3' 末端は XNUMX 番目のカットオフでトリミングされます。 の
アルゴリズムは BWA で使用されるものと同じです (ドキュメントを参照)。 (デフォルト: いいえ
トリミング)
--品質ベース=QUALITY_BASE
品質値は ascii(quality + QUALITY_BASE) としてエンコードされると仮定します。 の
デフォルト (33) は、一部のバージョンで生成される読み取りを除き、通常は正しいです。
Illumina パイプライン。これを 64 に設定する必要があります。(デフォルト: 33)
--トリム-n
読み取りの終わりで N をトリミングします。
-x プレフィックス、 --prefix=プレフィックス
名前を読み上げるにはこの接頭辞を追加します
-y サフィックス、 - サフィックス=サフィックス
名前を読み上げるにはこの接尾辞を追加します
--strip-suffix=ストリップ_サフィックス
このサフィックスが存在する場合は、読み取り名から削除します。 複数回与えることも可能です。
-c, - 色空間
カラースペース モード: 見つかったアダプターに隣接する色もトリミングします。
-d, --二重エンコード
カラースペース内では、カラーを二重エンコードします (0,1,2,3,4、XNUMX、XNUMX、XNUMX、XNUMX を A、C、G、T、N にマップします)。
-t, --トリムプライマー
カラースペースでは、プライマーベースと最初のカラー(トランジション)をトリムします。
最初のヌクレオチドまで)
--ストリップ-f3
カラースペースの場合: 読み取り名の _F3 サフィックスを削除します。
--maq, --ブワ
MAQ および BWA と互換性のある色空間出力。 これにより、 -c, -d, -t, --ストリップ-f3
-y '/1'。
--長さタグ=TAG
読み取りの説明フィールドで、TAG に続いて XNUMX 進数を検索します。
XNUMX 進数をトリミングされた読み取りの正しい長さに置き換えます。 ために
たとえば、使用します --長さタグ 「length=」は、「length=123」などのフィールドを修正します。
--ゼロキャップなし
負の品質値をゼロに変更しないでください。 の色空間品質値 -1
出力 FASTQ ファイルではスペースとして表示されます。 多くのツールには問題があるため、
これにより、色空間データをトリミングするときに負の品質がゼロに変換されます。
ネガティブな品質を維持するには、このオプションを使用します。
-z, --ゼロキャップ
負の品質値をゼロに変更します。 これは、次の場合にデフォルトで有効になります。
-c/--カラースペースも有効になります。 無効にするには、上記のオプションを使用します。
ペアエンド オプション。:
当学校区の -A/-G/-B/-U オプションは、それらのオプションと同様に機能します -a/-b/-g/-u に相当します。
-A アダプタ
3' アダプターはペアの XNUMX 番目の読み取りから削除されます。
-G アダプタ
5' アダプターはペアの XNUMX 番目の読み取りから削除されます。
-B アダプタ
5'/3 アダプターはペアの XNUMX 番目の読み取りから削除されます。
-U LENGTH
各読み取りの先頭または末尾から LENGTH 塩基を削除します (「 - 切る).
-p ファイル、 --ペア出力=FILE
ペアの XNUMX 番目の読み取りを FILE に書き込みます。
--トリムされていないペアの出力=FILE
最初の読み取りでアダプターが見つからなかった場合、ペアの XNUMX 番目の読み取りをこのファイルに書き込みます。
読む。 このオプションを一緒に使用します --トリミングされていない出力 ペアエンドをトリミングするとき
読みます。 (デフォルト: トリムされた読み取りと同じファイルに出力します。)
onworks.net サービスを使用してオンラインで Cutadapt を使用する
