英語フランス語スペイン語

Ad


OnWorksファビコン

ミニマップ - クラウド上のオンライン

Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターを介して、OnWorks の無料ホスティング プロバイダーでミニマップを実行します

これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド ミニマップです。

プログラム:

NAME


ミニマップ - 長い DNA 配列間の高速マッピング

SYNOPSIS


ミニマップ [-ISOV] [-k クメール] [-w winSize] [-I バッチサイズ] [-d ダンプファイル] [-f occThres] [-r
帯域幅] [-m 最小共有] [-c 最小カウント] [-L 最小一致] [-g 最大ギャップ] [-T ちりとり] [-t
nスレッド] [-x プリセット] ターゲット.fa クエリ.fa > 出力.paf

DESCRIPTION


ミニマップは、XNUMX つの間の複数のおおよそのマッピング位置を効率的に見つけるツールです。
リードと参照ゲノムの間、ゲノムとゲノムの間などの長い配列のセット
ノイズの多い長い読み取りの合間に。 ミニマップにはインデックス作成フェーズとマッピング フェーズがあります。 インデックス作成では
フェーズでは、ターゲット シーケンスの大きなバッチのすべてのミニマイザーをハッシュ テーブルに収集します。 の
マッピング フェーズでは、共線ミニマイザー ヒットの適切なクラスターを特定します。 ミニマップは行います
ターゲット配列とクエリ配列の間の詳細なアラインメントは生成されません。 それだけ
これらのクラスターのおおよその開始座標と終了座標を出力します。

OPTIONS


インデキシング オプション
-k INT ミニマイザー k-mer 長 [15]

-w INT 最小化ウィンドウ サイズ [k-mer 長さの 2/3]。 ミニマイザーは最小の k-mer です
w 連続する k-mer のウィンドウ内で。

-I NUM 最大ロード NUM インデックス作成のためにターゲット ベースを RAM に格納します [4G]。 以上ある場合
NUM の基地 ターゲット.fa、ミニマップを読み取る必要があります クエリ.fa 複数回マッピングする
ターゲット配列の各バッチに対して。 NUM k/K/m/M/g/G で終わる場合があります。

-d FILE ミニマイザーインデックスをダンプします FILE [ダンプなし]

-l それを示してください ターゲット.fa 実際にはオプションによって生成された最小化インデックスです -dはなく、
FASTA または FASTQ ファイル。

マッピング オプション
-f FLOAT 上部を無視する FLOAT 最も多く発生する最小値の割合 [0.001]

-r INT 初期ミニマイザーのおおよその帯域幅はクラスタリング [500] に達します。 あ ミニマイザー
ヒット ターゲット配列とクエリ配列の両方に存在するミニマイザーです。 あ ミニマイザー
ヒット ターゲット間で同一線上にある可能性のあるミニマイザー ヒットのグループです。
そしてクエリシーケンス。

-m FLOAT 次の場合に初期ミニマイザーのヒットクラスターをマージします。 FLOAT 以上のミニマイザーの割合
クラスタ間で共有される [0.5]

-c INT ミニマイザー ヒット クラスターが含まれている場合は保持します。 INT またはそれ以上のミニマイザー ヒット [4]

-L INT 共線化後に一致する数が減少した場合、ミニマイザー ヒット クラスターを破棄します。
拠点は下にあります INT [40]。 このオプションは主に出力のサイズを削減します。 それは持っています
速度とピークメモリにはほとんど影響しません。

-g INT ミニマイザーのヒットクラスターをギャップで分割する INT-bp以上を含まないもの
ミニマイザーのヒット [10000]

-T INT SDUST スコアしきい値を使用してクエリ シーケンス上の領域をマスクする INT; 無効にする場合は 0
[0]。 SDUST は、低複雑性のサブシーケンスを識別するアルゴリズムです。 そうではない
デフォルトで有効になっています。 SDUST が優先される場合は、20 ~ 25 の値が適しています。
おすすめされた。 しきい値が高くなると、マスクされるシーケンスが少なくなります。

-S 全対全マッピングを実行します。 このモードでは、クエリ シーケンス名が
ターゲット配列名より辞書順に大きい、それらの間のヒット
抑圧されるだろう。 クエリシーケンス名がターゲット名と同じ場合、
斜めのミニマイザーのヒットも抑制されます。

-O 他のヒットから遠く離れている場合は、ミニマイザー ヒットをドロップします (実験的)。 これ
このオプションは、XNUMX つの分岐した種からの長い染色体をマッピングするのに役立ちます。

-x STR に基づいて複数の設定を変更する STR [設定されていません]。 申請することをお勧めします
このオプションは他のオプションよりも先に、次のオプションがオーバーライドされる可能性があります。
このオプションによって変更される複数の設定。

ava10k PacBio または Oxford Nanopore の全対全読み取りマッピング (-Sw5 -L100 -m0)。

入出力 オプション
-t INT スレッド数 [3]。 ミニマップは収集時に最大 XNUMX つのスレッドを使用します
ターゲット シーケンスのミニマイザーを使用し、最大で INTマッピング時に +1 スレッド (
追加のスレッドは I/O 用であり、頻繁にアイドル状態になり、CPU 時間をほとんど要しません)。

-V バージョン番号を標準出力に出力します

出力 FORMAT


ミニマップは、Pairwise mApping Format (PAF) でマッピング位置を出力します。 PAF は TAB です。
で説明されているように、各行が少なくとも 12 個のフィールドで構成される区切りテキスト形式
次の表:

┌───┬─┬───────────────────────┐
鞍部タイプ説明
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┤
│ 1 │ 文字列 │ クエリシーケンス名 │
│ 2 │ int │ クエリシーケンス長 │
│ 3 │ int │ クエリ開始座標 (0 ベース) │
│ 4 │ int │ クエリ終了座標 (0 ベース) │
│ 5 │ char │ クエリとターゲットが同じストランド上の場合は `+'。 逆の場合は「-」 │
│ 6 │ 文字列 │ ターゲット配列名 │
│ 7 │ int │ ターゲット配列長 │
│ 8 │ int │ 元のストランド上のターゲット開始座標 │
│ 9 │ int │ 元のストランド上のターゲット終了座標 │
│ 10 │ int │ マッピング内で一致する塩基の数 │
│ 11 │ int │ マッピング内の基数 (ギャップを含む) │
│ 12 │ int │ マッピング品質 (0 ~ 255、欠落の場合は 255) │
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┘

アライメントが利用可能な場合、列 11 にはシーケンス一致の合計数が表示されます。
アライメントの不一致とギャップ。 列 10 を列 11 で割ると、配置が得られます。
身元。 ミニマップは詳細な配置を生成しないため、これら XNUMX つの列は
近似。 PAF には、必要に応じて、SAM と同様に型指定されたキーと値に追加のフィールドを含めることができます。
フォーマット。 ミニマップは、クラスター内のミニマイザーのヒット数を cm タグに書き込みます。

onworks.net サービスを使用してオンラインでミニマップを使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

Linuxコマンド

Ad