これは、Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、MACOSオンラインエミュレーターなどの複数の無料オンラインワークステーションのXNUMXつを使用してOnWorks無料ホスティングプロバイダーで実行できるコマンドabyss-peです。
プログラム:
NAME
abyss-pe-読み取りをコンティグにアセンブルします
SYNOPSIS
アビスペ [オプション] ... [パラメータ=VALUE] ... [MAKE_TARGET] ...
DESCRIPTION
入力ファイルの読み取りをコンティグにアセンブルします。 読み取りはFASTA、FASTQ、
qseq、export、SRA、SAM、またはBAM形式で、gz、bz2、またはxzで圧縮でき、
タール。
abyss-peはMakefileスクリプトです。 makeの任意のオプションは、abyss-peでも使用できます。
計測パラメータ of アビスペ
名, 職種名
このアセンブリの名前。 結果の足場はに保存されます
$ {name} -scaffolds.fa。
in 入力ファイル。 単一のライブラリからデータを組み立てるときにこの変数を使用します。
リブ 空白で区切られたペアエンドライブラリ名の引用リスト。 この変数を使用してください
複数のペアエンドライブラリからデータをアセンブルする場合。 のライブラリ名ごとに
libの場合、ユーザーはコマンドラインで同じ名前の変数を定義する必要があります。
そのライブラリの読み取りファイルを示します。 見る 例 コンクリートについては以下
使用例。
pe unitigをにマージするためにのみ使用されるペアエンドライブラリのリスト
コンティグであり、コンセンサス配列に貢献しません。
mp 足場に使用されるメイトペアライブラリのリスト。 メイトペアライブラリ
コンセンサス配列に貢献しないでください。
長い 再足場に使用される長いシーケンスライブラリのリスト。 長いシーケンス
ライブラリはコンセンサス配列に寄与しません。
se シングルエンド読み取りを含むファイル
a バブルの最大分岐数[2]
b バブルの最大長(bp)[10000]
c ユニティグの最小平均k-merカバレッジ[平方根(中央値)]
d 距離推定の許容誤差(bp)[6]
e 最小侵食k-merカバレッジ[平方根(中央値)]
E ストランドあたりの最小侵食k-merカバレッジ[1]
j スレッド数[2]
k k-merのサイズ(Kが設定されていない場合)またはk-merペアのスパン(Kが設定されている場合)
K k-merペアの単一のk-merのサイズ(bp)
l リードの最小アラインメント長(bp)[k]
m 30つのユニティグの最小オーバーラップ(bp)[XNUMX]
n コンティグの構築に必要なペアの最小数[10]
N 足場を構築するために必要なペアの最小数[n]
p バブルの最小配列同一性[0.9]
q トリミング時の最低基本品質[3]
品質が低いqの読み取りの終わりから塩基をトリミングします。
Q 最小基本品質[0]
品質がQ未満の読み取りのすべての塩基を `N 'としてマスクします。
s コンティグの構築に必要な最小ユニティグサイズ(bp)[200]
シードの長さは、kの値の少なくともXNUMX倍である必要があります。 より多くのシーケンスがある場合
予想されるゲノムサイズよりも組み立てられている場合は、sを増やしてみてください。
S 足場の構築に必要な最小コンティグサイズ(bp)[s]
SS SS =-ストランド固有モードでアセンブルするSS
すべてのライブラリが鎖特異的RNA-Seqライブラリである必要があります。 それを仮定します
リードペアの最初のリードは、シーケンスされたトランスクリプトのWRTで逆になります。
t 最小チップサイズ(bp)[2k]
v v = -vは、詳細ログを有効にします
np, NSスロット
MPIアセンブリのプロセス数
ムピルン mpirunへのパス
合わせ
読み取りをコンティグに合わせるために使用するプログラム[マップ]。
許可される値は、map、kaligner、bwa、bwasw、bowtie、bowtie2、didaです。 を参照してください
ディダ didaオプションの詳細については、以下のセクションを参照してください。
cs 組み立て後、色空間コンティグをヌクレオチドコンティグに変換します
オプション of make
-n, -ドライラン
実行されるコマンドを印刷しますが、実行しないでください。
アカウントを作成し ターゲット for アビスペ
デフォルト
「足場足場-ドット統計」に相当します。
ユニティグ
ユニティグを組み立てます。
unitigs-ドット
ユニティグオーバーラップグラフを出力します。
ペサム ペアエンドリードをunitigにマップし、SAMファイルを出力します。 SAMファイルは
異なるコンティグへの読み取りマッピング、および読み取りID、シーケンス、品質が含まれています
文字列は「*」文字に置き換えられます。
ペバム ペアエンドリードをunitigにマップし、BAMファイルを出力します。 BAMファイルは
異なるコンティグへの読み取りマッピング、および読み取りID、シーケンス、品質が含まれています
文字列は「*」文字に置き換えられます。
pe-index
abyss-mapで使用されるunitigのインデックスを生成します。
コンティグ
コンティグを組み立てます。
コンティグドット
コンティグオーバーラップグラフを出力します。
mp-サム メイトペアリードをコンティグにマップし、SAMファイルを出力します。 SAMファイルは
異なるコンティグへの読み取りマッピング、および読み取りID、シーケンス、品質が含まれています
文字列は「*」文字に置き換えられます。
mp-bam メイトペアリードをコンティグにマップし、BAMファイルを出力します。 BAMファイルは
異なるコンティグへの読み取りマッピング、および読み取りID、シーケンス、品質が含まれています
文字列は「*」文字に置き換えられます。
mp インデックス
abyss-mapが使用するコンティグのインデックスを生成します。
足場
足場を組み立てます。
足場-ドット
スキャフォールドオーバーラップグラフを出力します。
スカフティグ
足場を壊し、AGPファイルを生成します。
長い足場
RNA-Seqで組み立てられたコンティグを使用してRescaffoldします。
長い足場ドット
RNAスキャフォールドオーバーラップグラフを出力します。
統計情報 アセンブリ隣接統計を表示します。
中間ファイルを削除します。
バージョン
abyss-peのバージョンを表示します。
バージョン
abyss-peが使用するすべてのプログラムのバージョンを表示します。
助けます 役立つメッセージを表示します。
ディダ
ABySSは、MPIベースのDIDA(Distributed Indexing Dispatched Alignment)の使用をサポートしています。
複数のマシン間でシーケンスアラインメントを計算するためのアラインメントフレームワーク。 使用するには
ABySSを使用したDIDA、最初にDIDAをダウンロードしてインストールします。
http://www.bcgsc.ca/platform/bioinfo/software/dida、次に、の値として `dida`を指定します。
合わせ パラメータを アビスペ.
DIDA関連 アビスペ パラメータ
DIDA_MPIRUN
DIDAジョブの実行に使用される `mpirun`コマンド。
DIDA_RUN_OPTIONS
MPIランクごとのスレッド数や環境の値などのランタイムオプション
変数(例:PATH、LD_LIBRARY_PATH)。 のリストについては、 `abyss-dida--help`を実行してください
利用可能なオプション。
DIDA_OPTIONS
DIDAバイナリに直接渡されるオプション。 たとえば、これを使用できます
最小アライメント長のしきい値を制御します。 `dida-wrapper--help`を実行して
利用可能なオプションのリスト。
のMPI 互換性の確保
マルチスレッドを使用しているため、DIDAはOpenMPIでのデッドロックの問題を認識しています。 使用する
DIDAを使用してアセンブリを実行する場合は、MPICHMPIライブラリを強くお勧めします。 テスト
--enable-threads = funneledでコンパイルされたMPICH3.1.3で実行されました。
実施例
DIDAの推奨されるランタイム構成は、マシンごとに1 MPIランク、マシンごとに1スレッドです。
CPUコア。 たとえば、それぞれ3コアの12つのクラスターノード間でアセンブリを実行するには、次のようにします。
abyss-pe k = 64 name = ecoli in = 'reads1.fa read2.fa' aligner = dida
DIDA_RUN_OPTIONS = '-j12' DIDA_MPIRUN = 'mpirun -np 3 -ppn 1 -bind-to board'
この例では、 `mpirun`のMPICHコマンドラインオプションを使用しています。 ここで、 `-np3`は
MPIランクの数、 `-ppn 1`は、「ノード」ごとのMPIランクの数を示します。
`-bind-to board`は、「ノード」をマザーボード(つまりフルマシン)として定義します。
ENVIRONMENT 変数
コマンドラインで指定できるパラメータは、
環境変数。
パス ABySS実行可能ファイルがインストールされているディレクトリが含まれている必要があります。 `abyss-を使用する
pe version`を使用して、PATHが正しく構成されていることを確認します。
TMPDIR 一時ファイルに使用するディレクトリを指定します
スケジューラ 統合
ABySSは、次のようなクラスタージョブスケジューラとうまく統合されます。
* SGE(Sun Grid Engine)
*ポータブルバッチシステム(PBS)
*負荷分散機能(LSF)
* IBM ロードレベラー
SGE環境変数JOB_NAME、SGE_TASK_ID、およびNSLOTSを使用して、
パラメータ名、kおよびnp、および他のスケジューラについても同様です。
例
1 ペアエンド ライブラリ
abyss-pe k = 64 name = ecoli in = 'reads1.fa read2.fa'
複数 ペアエンド ライブラリ
abyss-pe k = 64 name = ecoli lib = 'lib1 lib2' \
lib1='lib1_1.fa lib1_2.fa' lib2='lib2_1.fa lib2_2.fa' \
se = 'se1.fa se2.fa'
ペアエンド & メイトペア ライブラリ
abyss-pe k = 64 name = ecoli lib = 'pe1 pe2' mp = 'mp1 mp2' \
pe1='pe1_1.fa pe1_2.fa' pe2='pe2_1.fa pe2_2.fa' \
mp1='mp1_1.fa mp1_2.fa' mp2='mp2_1.fa mp2_2.fa' \
se = 'se1.fa se2.fa'
含めて RNA配列決定 アセンブリ
abyss-pe k = 64 name = ecoli lib = pe1 mp = mp1 long = long1 \
pe1='pe1_1.fa pe1_2.fa' mp1='mp1_1.fa mp1_2.fa' \
long1 = long1.fa
のMPI
abyss-pe np = 8 k = 64 name = ecoli in = 'reads1.fa read2.fa'
SGE
qsub -N ecoli -t 64 -pe openmpi 8 \
abyss-pe n = 10 in = 'reads1.fa read2.fa'
onworks.netサービスを使用してabyss-peをオンラインで使用する