英語フランス語スペイン語

Ad


OnWorksファビコン

daligner-クラウドでのオンライン

Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、またはMACOSオンラインエミュレーターを介してOnWorks無料ホスティングプロバイダーでdalignerを実行します

これは、Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、MACOSオンラインエミュレーターなどの複数の無料オンラインワークステーションのXNUMXつを使用してOnWorks無料ホスティングプロバイダーで実行できるコマンドダリナーです。

プログラム:

NAME


daligner-ロングリードアライナー

SYNOPSIS


ダリナー [-vbAI][-kint型(14)] [-wint型(6)] [-hint型(35)] [-tint型] [-Mint型] [-eダブル(.70)]
[-lint型(1000)] [-sint型(100)] [-Hint型] [-m追跡する]+ 件名:db | dam target:db | dam ...

DESCRIPTION


トリミングされたシーケンスを比較します テーマ のリストにあるものに対してブロックする ターゲット ブロック
少なくとも関与するローカルアラインメントの検索 -l 塩基対(デフォルトは1000)以上、
平均相関率が -e (デフォルトは70%)。 見つかったローカルアラインメント
アライメント上のトレースポイントが毎回記録されるスパースエンコーディングで出力されます
-s a-readの塩基対(デフォルトは100bp)。 読み取りは両方の方向で比較され、
基準を満たすローカルアラインメントは、説明されているいくつかの作成されたファイルのXNUMXつに出力されます
未満。 の -v オプションは、それぞれの統計を提供する詳細レポートモードをオンにします
計算の主要なステップ。

オプション -k, -h, -w 一致する可能性のある最初のフィルタリング検索を制御します
読み取りの間に。 具体的には、検索コードは幅の対角線バンドのペアを探します
完全に一致するk-merのコレクションを含む2 ^ w(デフォルトは2 ^ 6 = 64)(デフォルトは14)
XNUMXつの読み取りの間に、k-merヒットでカバーされる塩基の総数がhになるようにします。
(デフォルトは35)。 現在の実装では、kを32より大きくすることはできません。 の場合 -b オプション
が設定されたら、 ダリナー データに強い組成バイアスがあることを前提としています(例:> 65%AT
リッチ)、そしてもう少し時間がかかりますが、それに応じてk-merサイズを動的に調整します
組成バイアス。使用されるマーは4 ^ kの有効特異性を持ちます。

で指定されたインターバルトラックがXNUMXつ以上ある場合 -m オプション、次にの読み取り
マスクが適用されるXNUMXつまたは複数のDBは、間隔の和集合でソフトマスクされます
適用されるすべてのインターバルトラックの中で、つまり、いずれかの塩基を含む任意のk-mer
一致をシードするために、マスクされた間隔は無視されます。 インターバルトラック
は、DBdustによって作成された「ダスト」トラックなど、一連の間隔をエンコードするトラックです。
トリミングされていないDBまたはトリミングされたDBのいずれかを介して。

常に、一部のk-merは大幅に過剰に表現されています(ホモポリマーの実行など)。
これらのk-merは、一致するk-merペアの数が多すぎて、アドレス指定されないままになります。
dalignerが使用可能な物理メモリをオーバーフローさせます。 これに対処するXNUMXつの方法は、
明示的に設定する -t より多く発生するk-merの使用を抑制するパラメータ
より t サブジェクトブロックまたはターゲットブロックのいずれかでの時間。 ただし、
状況は、プログラムに値を自動的に選択させることです。 t 与えられたものを満たす
によって指定されたメモリ使用制限(Gb単位) -M パラメータ。 デフォルトでは ダリナー 使用する
の選択としての物理メモリの量 -M。 使用量を減らしたい場合は、8Gbとだけ言ってください
24を実行するため、3GbHPCクラスターノードで ダリナー ノード上のジョブ、次に
指定する -M8。 指定する -M0 基本的にあなたがしたくないことを示します ダリナー 自己へ
所定のメモリ量に収まるようにk-mer抑制を調整します。

各サブジェクト、たとえばXとYのブロックのターゲットペアについて、プログラムはアライメントを報告します。
a-readはXにあり、b-readはYにあり、その逆も同様です。 ただし、 -A オプションがある
set( "asymmetric"の場合は "A")すると、a-readがXにあり、b-readがXにある場合にオーバーラップします。
Yで報告され、X = Yの場合、さらに、
a-readインデックスはb-readインデックスよりも小さいです。 いずれの場合も、 -I オプションが設定されています(「I」
「同一性」の場合)X = Yの場合、同じ読み取りの異なる部分間でオーバーラップします
また、発見され、報告されます。

見つかった各配置は、-a [ab、ae] x bo [bb、be]-として記録されます。ここで、aとbは
オーバーラップするリードのインデックス(トリミングされたDB内)、oはbリードが
同じまたは反対のストランドから、[ab、ae]と[bb、be]はaとboの間隔です。
それぞれ、整列します。 プログラムは、これらのアライメントレコードを名前のファイルに配置します
はXY [C | N]#。lasの形式です。ここで、Cは、bリードが補完され、Nであることを示します。
それらがそうではないことを示し(両方の比較が実行されます)、#は検出されたスレッドです
ファイルに含まれている配置のコレクションを書き出しました。 それがファイルです
XYO#.lasには、スレッド#によって生成されたアライメントが含まれています。
b-readはYからのもので、方向はOです。コマンド ダリナー -A X Y 2 * NTHREADを生成します
スレッドファイルXY?.lasおよび ダリナー X Y 4 * NTHREADファイルXY?.lasおよびYX?.lasを生成します
(ただし、 X=Y この場合、NTHREADファイルXX?.lasのみが生成されます)。

デフォルトでは、 ダリナー データベース内の読み取り間の重複が大きい​​ものをすべて比較します
1つまたは複数のDBが分割されたときの最小カットオフセットよりも、通常は2またはXNUMXKbpです。 しかし、
HGAPアセンブリパイプラインは、8Kbp以上などの大きな読み取りのみを修正する必要があります。
a-readが大きな読み取りのXNUMXつである場合、オーバーラップのみが必要です。 を設定することにより -H
Nと言うパラメータ、XNUMXつは変更します ダリナー a-readが重複している場合にのみレポートするようにします
N塩基対以上の長さです。

デフォルトのパラメータ設定は生のPacbioデータに適していますが、 ダリナー 使用することができる
修正された読み取りまたは他のノイズの少ない読み取りでアライメントを効率的に見つけるため。 にとって
たとえば、アプリケーションを.damsに対してマッピングするには、次のコマンドを実行します。

ダリナー -k20 -h60 -e.85

修正された読み取りでは、通常、

ダリナー -k25 -w5 -h60 -e.95 -s500

これらの設定では、非常に高速です。

onworks.netサービスを使用してオンラインでdalignerを使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

Linuxコマンド

Ad