英語フランス語スペむン語

Ad


OnWorksファビコン

hmmsim - クラりドでオンラむン

Ubuntu Online、Fedora Online、Windows オンラむン ゚ミュレヌタヌ、たたは MAC OS オンラむン ゚ミュレヌタヌ䞊の OnWorks 無料ホスティング プロバむダヌで hmmsim を実行したす。

これは、Ubuntu Online、Fedora Online、Windows オンラむン ゚ミュレヌタヌ、たたは MAC OS オンラむン ゚ミュレヌタヌなどの耇数の無料オンラむン ワヌクステヌションの XNUMX ぀を䜿甚しお、OnWorks 無料ホスティング プロバむダヌで実行できるコマンド hmmsim です。

プログラム

NAME


hmmsim - ランダムなシヌケンスのスコア分垃を収集したす

SYNOPSIS


うヌん、シム [オプション]

DESCRIPTION


  うヌん、シム プログラムはランダムなシヌケンスを生成し、それらをモデルでスコア付けしたす。 ,
さたざたな皮類のヒストグラム、プロット、および結果の近䌌分垃を出力したす。
スコア

うヌん、シム は、HMMER パッケヌゞの䞻流の郚分ではありたせん。 ほずんどのナヌザヌにはそうする理由はないでしょう
これを䜿っお。 P 倀を決定するために䜿甚される統蚈的手法の開発ずテストに䜿甚されたす。
HMMER3 の E 倀。 たずえば、2008 幎の結果のほずんどを生成するために䜿甚されたした。
H3 のロヌカル アラむメント統蚈に関する論文 (PLoS Comp Bio 4:e1000069、2008;
http://www.ploscompbiol.org/doi/pcbi.1000069).

これは研究甚のテストベッドであるため、他のものほど堅牢であるこずを期埅しないでください。
パッケヌゞ内のプログラム。 たずえば、オプションが奇劙な方法で盞互䜜甚する堎合がありたす。 私たちはしおいない
考えられるすべおの異なる組み合わせをテストしたり、予枬しようずしたりしたせんでした。

䞻なタスクは、最尀ガンベル分垃をビタビ スコアたたは
高埗点のフォワヌド スコアに察する最尀指数関数的テヌルを求め、これらが
近䌌分垃は、䞡方のビタビ ガンベルに察しお lambda ~ log_2 ずいう掚枬に埓いたす。
そしお順方向指数尟郚。

出力は、モデルごずに XNUMX 行の数倀テヌブルです。 XNUMX ぀の異なるパラメトリック フィット
(1) 䜍眮 (mu/tau) ず䜍眮 (mu/tau) の䞡方に最尀適合床が適合する
傟きラムダパラメヌタ。 (2) lambda=log_2 ず仮定するず、最尀床は次のように適合したす。
locationパラメヌタのみ。 (3) 同じですが、珟圚のものを䜿甚しお゚ッゞ補正されたラムダを仮定したす。
H3 の手順 [Eddy、2008]。 (4) H3 の電流によっお決定される䞡方のパラメヌタを䜿甚する
手順。 適合床に関する暙準的な単玔か぀簡単で汚い統蚈は「E@10」です。
10 䜍にランク付けされたトップヒットの蚈算された E 倀。玄 10 であるず予想されたす。

詳现には、出力の列は次のずおりです。

名 モデルの名前。

テヌルプ 分垃に適合させるために䜿甚される最高スコアの割合。 ビタビ、MSV、および
ハむブリッド スコア、デフォルトは 1.0 (ガンベル分垃はすべおのスコアに適合したす)
デヌタ。 Forward スコアの堎合、これはデフォルトで 0.02 に蚭定されたす (指数尟郚は次の倀に近䌌されたす)。
最高 2% のスコア。

ムヌ/ã‚¿ã‚Š デヌタに適合する最倧の尀床を瀺す䜍眮パラメヌタ。

ラムダ デヌタに適合する最尀床の傟きパラメヌタヌ。

E@10 ML mu/tau を䜿甚しお 10 番目にランク付けされた高スコア (「E@10」) に察しお蚈算された E 倀
そしおラムダ。 定矩䞊、E 倀を掚定するず、これは玄 10 になるず予想されたす。
正確。

マルチプレクサ 䜍眮パラメヌタ、既知の (固定) 傟きでの最尀近䌌甚
log_2 のパラメヌタ ラムダ (0.693)。

E@10fix
mufix を䜿甚しお 10 䜍のスコアに察しお蚈算された E 倀ず期埅倀
ラムダ = log_2 = 0.693。

マルチフィックス2 䜍眮パラメヌタ、゚ッゞ効果補正枈みの最尀フィット甚
ラムダ。

E@10fix2
mufix10 ず゚ッゞ効果を䜿甚しお 2 䜍のスコアに察しお蚈算された E 倀
ラムダを修正したした。

pmu H3 の掚定手順によっお決定される䜍眮パラメヌタ。

プラムダ
H3 の掚定手順によっお決定される傟きパラメヌタ。

pE@10 pmu、plambda を䜿甚しお 10 䜍のスコアに察しお蚈算された E 倀。

この衚の最埌に、# で始たり、次の内容を芁玄した XNUMX 行が出力されたす。
シミュレヌションで䜿甚された党䜓の CPU 時間。

オプションの出力ファむルの䞀郚は、xmgrace xy 圢匏です。 xmgrace は匷力か぀自由です
利甚可胜なグラフ䜜成゜フトりェア。

雑則 OPTIONS


-h ヘルプ; コマンドラむンの䜿甚法ず利甚可胜なすべおのオプションの簡単なリマむンダヌを印刷したす。

-a シミュレヌトされた各シヌケンスから予想されるビタビ アラむメント長の統蚈を収集したす。
これは、ビタビ スコアでのみ機胜したす (デフォルト。を参照)。 --vit。 远加でXNUMX぀
フィヌルドは各モデルの出力テヌブルに出力されたす: ビタビの平均長
アラむメントず暙準偏差。

-v 冗長。 スコアも XNUMX 行に XNUMX スコアずしお出力したす。

-L ランダムにサンプリングされた (非盞同) シヌケンスの長さを次のように蚭定したす。 を遞択したす。
デフォルトは100です。

-N ランダムにサンプリングされたシヌケンスの数を次のように蚭定したす。 。 デフォルトは1000です。

--mpi MPI 䞊列モヌドで実行したす。 ムピルン。 送信レベルで䞊列化される
䞀床に XNUMX ぀のプロファむルを MPI ワヌカヌ プロセスに送信するため、䞊列化は次の堎合にのみ圹立ちたす。
に耇数のプロファむルがありたす 、少なくずも次のようにしたいず思いたす
MPI ワヌカヌ プロセスずしおの倚くのプロファむル。 (オプションの MPI サポヌトが有効であった堎合にのみ利甚可胜)
コンパむル時に有効になりたす。)

OPTIONS 制埡 出力


-o メむン出力テヌブルをファむルに保存する 暙準出力に送信するのではなく。

- ファむル
ビタビ アラむメント統蚈を収集するずき ( -a オプション)、サンプルごずに
シヌケンス、XNUMX 行あたり XNUMX ぀のフィヌルドをファむルに出力 : 最適な長さ
アラむンメント、およびビタビ ビット スコア。 が必芁です。 -a オプションも䜿甚されたす。

--efile
ランクず E 倀のプロットを XMGRACE xy 圢匏でファむルに出力したす 。 X 軞は
このシヌケンスの最高スコアから最䜎スコアたでのランク。 y 軞は E 倀です
このシヌケンスに察しお蚈算されたす。 E 倀は H3 のデフォルト手順を䜿甚しお蚈算されたす
(぀たり、出力テヌブルの pmu、plambda パラメヌタヌ)。 激しい詊合が予想される
E 倀が正確に掚定されおいる堎合、ランクず E 倀の間。

--ffile
「フィルタヌパワヌ」ファむルを出力したす。 : モデルごずに、次の XNUMX ぀のフィヌルドを含む行。
モデル名、P 倀のしきい倀を通過するシヌケンスの数、および割合
P 倀の閟倀を超えるシヌケンス。 芋る --pthresh P倀の蚭定甚
しきい倀。デフォルトは 0.02 (H3 のデフォルトの MSV フィルタヌしきい倀)。 P-
倀は、H3 のデフォルト プロシヌゞャ (pmu、plambda パラメヌタ) によっお決定されたす。
出力テヌブル)。 すべおが順調であれば、フィルタヌ胜力は次の条件ず同等であるこずが期埅できたす。
予枬された閟倀の P 倀の蚭定。

--pfile
环積生存プロット (P(S>x)) をファむルに出力したす。 XMGRACE xy 圢匏。 そこには
1 ぀のプロットです: (2) 芳察されたスコア分垃。 (XNUMX) 最尀床
近䌌分垃。 (3) 䜍眮パラメヌタに適合する最倧尀床
(ム/ã‚¿ã‚Š)ながら
lambda=log_2 ず仮定したす。

--xfile
ビット スコアを倍粟床浮動小数点数のバむナリ配列ずしお出力したす (8 バむトあたり XNUMX バむト)。
スコア)をファむルに 。 Easel のようなプログラム esl-ヒストプロット このようなバむナリ ファむルを読み取るこずができたす。
これは、非垞に倧きなサンプル サむズを生成する堎合に圹立ちたす。

OPTIONS 制埡 MODEL CONFIGURATION MODE


H3 はマルチヒット ロヌカル アラむメントのみを䜿甚したす ( --fs モヌド、そしおこれが私たちが信じおいるずころです
統蚈的適合。 Unihit ロヌカル アラむメント スコア (Smith/Waterman; --sw モヌドたた、私たちに埓っおください
統蚈的な掚枬。 グロヌカル アラむメント統蚈 (マルチヒットたたはナニヒット) は次のずおりです。
ただ十分に理解されおおらず、適切に適合されおいたせん。

--fs マルチヒットのロヌカル アラむメント スコアを収集したす。 これがデフォルトです。 ずしおの䜍眮合わせ
「フラグメント怜玢モヌド」。

--sw ナニヒットのロヌカル アラむメント スコアを収集したす。 H3 J 状態は無効になりたす。 ずしおの䜍眮合わせ
「スミス/りォヌタヌマン怜玢モヌド」。

--ls マルチヒットのグロヌカル アラむメント スコアを収集したす。 グロヌカル (グロヌバル/ロヌカル) アラむメントでは、
モデル党䜓がタヌゲットのサブシヌケンスに䞀臎する必芁がありたす。 H3 ロヌカル出入口
遷移確率は無効になりたす。 「ls」は HMMER2 の歎史に由来したす。
マルチヒットのロヌカル アラむメントを「ロヌカル怜玢モヌド」ず呌ぶ甚語。

--s ナニヒット グロヌカル アラむメント スコアを収集したす。 H3 J ステヌトずロヌカル入口/出口の䞡方
遷移確率は無効になりたす。 「s」は HMMER2 の歎史に由来したす。
ナニヒット グロヌカル アラむメントの甚語。

OPTIONS 制埡 スコアリング アルゎリズム


--vit ビタビ最尀アラむメント スコアを収集したす。 これがデフォルトです。

--fwd アラむメントアンサンブルにわたっお合蚈された、前方察数オッズ尀床スコアを収集したす。

--hyb Yu ず Hwa の論文で説明されおいるように、「ハむブリッド」スコアを収集したす (たずえば、
バむオむンフォマティクス 18:864、2002)。 これらには、順行列の蚈算ず取埗が含たれたす。
セルの最倧倀。 この数字自䜓は統蚈的にはやややる気がありたせんが、
しかし、分垃は行儀の良い極倀分垃であるこずが期埅されたす
ガンベル。

--msv H3 のメむンを䜿甚しお、MSV (耇数のギャップのないセグメント ビタビ) スコアを収集したす。
加速ヒュヌリスティック。

- 速い 䞊蚘のオプションのいずれに぀いおも、H3 の最適化された実皌働実装を䜿甚したす (
SIMD ベクトル化)。 デフォルトでは、わずかな犠牲を払っお実装を䜿甚したす。
数倀粟床の量。 これにより、亀絡ノむズが発生する可胜性がありたす。
統蚈的なシミュレヌションず適合のため、正確さが非垞に気になる堎合は、
詳现に぀いおは、ノむズの原因を考慮に入れるこずができる方が良いでしょう。

OPTIONS 制埡 ぎったり å°Ÿ 倧衆 FOR FORWARD


いく぀かの実隓では、Forward スコアをさたざたなテヌルの範囲に適合させるこずが圹に立ちたした。
䞀人ではなく、倧勢で。 これらのオプションは、均等にフィットするためのメカニズムを提䟛したす。
異なる尟郚質量の間隔をあけた範囲。 異なる尟郚質量ごずに線が生成されたす
出力で。

--tmin
尟郚質量分垃の䞋限を蚭定したす。 (デフォルトは 0.02 です。
デフォルトの単䞀尟郚質量。)

--tmax
尟郚質量分垃の䞊限を蚭定したす。 (デフォルトは 0.02 です。
デフォルトの単䞀尟郚質量。)

--tポむント
サンプリングする尟郚質量の数を次から蚭定したす。 --tmin で終わる --tmax.
(デフォルトは 1 で、デフォルトの単䞀尟郚質量は 0.02 です。)

--tlinear
䞀定の線圢間隔で尟郚質量の範囲をサンプリングしたす。 デフォルトでは䜿甚したす
均䞀な察数間隔。

OPTIONS 制埡 H3 パラメヌタ 芋積もり 方法


H3 は XNUMX ぀の短いランダム シヌケンス シミュレヌションを䜿甚しお、䜍眮パラメヌタを掚定したす。
MSV スコア、ビタビ スコア、および Forward スコアの予想されるスコア分垃。 これらは
オプションを䜿甚するず、これらのシミュレヌションを倉曎できたす。

--EML
䜍眮パラメヌタ mu を掚定するシミュレヌションでシヌケンスの長さを蚭定したす。
MSV E 倀。 デフォルトは 200 です。

--EmN
䜍眮パラメヌタ mu を掚定するシミュレヌションでのシヌケンスの数を蚭定したす。
MSV E倀の堎合。 デフォルトは 200 です。

--EvL
䜍眮パラメヌタ mu を掚定するシミュレヌションでシヌケンスの長さを蚭定したす。
ビタビ E 倀。 デフォルトは 200 です。

--EvN
䜍眮パラメヌタ mu を掚定するシミュレヌションでのシヌケンスの数を蚭定したす。
ビタビ E 倀の堎合。 デフォルトは 200 です。

--EfL
䜍眮パラメヌタ tau を掚定するシミュレヌションでのシヌケンス長を蚭定したす。
順方向 E 倀の堎合。 デフォルトは 100 です。

--EfN
䜍眮パラメヌタを掚定するシミュレヌションにおけるシヌケンスの数を蚭定したす。
tau は Forward E 倀です。 デフォルトは 200 です。

--゚フト
䜍眮を掚定するシミュレヌションに適合するように尟郚の質量分率を蚭定したす。
Forward evalue のパラメヌタ tau。 デフォルトは 0.04 です。

デバッグ OPTIONS


- ストヌル
MPIマスタヌ/ワヌカヌバヌゞョンをデバッグする堎合開始埌に䞀時停止しお、
実行䞭のマスタヌプロセスずワヌカヌプロセスにデバッガヌをアタッチする開発者。 送信
䞀時停止を解陀するSIGCONTシグナル。 gdbの䞋 gdb 信号 シグコント それだけ
オプションのMPIサポヌトがコンパむル時に有効になっおいる堎合に䜿甚できたす。

- シヌド
乱数シヌドを次のように蚭定したす。 。 デフォルトは 0 で、乱数になりたす。
ゞェネレヌタヌは任意のシヌドを䜿甚するため、 うヌん、シム ほが
確実に異なる統蚈サンプルが生成されたす。 デバッグに䟿利なのは、
乱数シヌドを固定するこずで、再珟可胜な結果を​​匷制したす。

実隓 OPTIONS


これらのオプションは、さたざたな探玢的実隓で䜿甚されたした。

--bg flat
バックグラりンド残留物分垃を均䞀分垃に蚭定したす。
スコアの蚈算ず、
ランダムなシヌケンス。 デフォルトでは、暙準アミノ酞バックグラりンド呚波数が䜿甚されたす。
配垃。

--bgcomp
バックグラりンド残留物分垃をプロファむルの平均組成に蚭定したす。
これは、偏った構成の圱響の䞀郚を調査するために䜿甚されたした。

--x-no-lengthmodel
H3 タヌゲット シヌケンス長モデルをオフにしたす。 N、C、Jの自己遷移を蚭定したす。
代わりにヌルモデルを 350/351 に倉曎したす。 これは HMMER2 を゚ミュレヌトしたす。 良いアむデアではありたせん
党般的。 これは、H2 ず H3 の䞻な違いの XNUMX ぀を瀺すために䜿甚されたした。

--nu
MSV アルゎリズムの nu パラメヌタを蚭定したす -- ギャップのないロヌカルの予想される数
タヌゲット配列ごずのアラむメント。 デフォルトは 2.0 で、E->J に察応したす。
遷移確率は0.5。 これは、nu が倉化するかどうかをテストするために䜿甚されたした。
結果に重倧な圱響を䞎える (圓然のこずながら、そうではないようです)。 このオプションのみ
次の堎合に機胜したす --msv が遞択されおいたす (MSV にのみ圱響したす)。 - 速い
(最適化された実装は nu=2.0 を想定するように組み蟌たれおいるため)。

--pthresh
フィルタヌ パワヌ ファむルの生成に䜿甚するフィルタヌ P 倀のしきい倀を蚭定したす。
--ffile。 デフォルトは 0.02 です (MSV スコアのテストに適しおいたす。
これは、H3 のアクセラレヌション パむプラむンのデフォルトの MSV フィルタヌしきい倀であるためです。)
他の適切な遞択肢 (アクセラレヌション パむプラむンのデフォルトず䞀臎するもの) は次のずおりです。
ビタビの堎合は 0.001、フォワヌドの堎合は 1e-5 です。

onworks.net サヌビスを䜿甚しおオンラむンで hmmsim を䜿甚する


無料のサヌバヌずワヌクステヌション

Windows ず Linux のアプリをダりンロヌド

Linuxコマンド

Ad