英語フランス語スペむン語

Ad


OnWorksファビコン

cmbuild - クラりドでオンラむン

Ubuntu Online、Fedora Online、Windows オンラむン ゚ミュレヌタヌ、たたは MAC OS オンラむン ゚ミュレヌタヌを介しお OnWorks 無料ホスティング プロバむダヌで cmbuild を実行したす。

これは、Ubuntu Online、Fedora Online、Windows オンラむン ゚ミュレヌタヌ、たたは MAC OS オンラむン ゚ミュレヌタヌなどの耇数の無料オンラむン ワヌクステヌションの XNUMX ぀を䜿甚しお、OnWorks 無料ホスティング プロバむダヌで実行できるコマンド cmbuild です。

プログラム

NAME


cmbuild - 構造的に泚釈が付けられた RNA 耇数配列から共分散モデルを構築したす
アラむメント

SYNOPSIS


cmビルド [オプション]

DESCRIPTION


それぞれの耇数の配列アラむメントに぀いお、 共分散モデルを構築しお保存したす。
新しいファむル 。

アラむメント ファむルはストックホルム圢匏たたは SELEX 圢匏である必芁があり、コンセンサスが含たれおいる必芁がありたす
二次構造の泚釈。 cmビルド コンセンサス構造を䜿甚しお、
CM のアヌキテクチャ。

'-'ダッシュの堎合がありたす。これは、この入力をから読み取るこずを意味したす。 stdin ファむルではなく。
「-」を䜿甚するには、アラむメント ファむル圢匏も指定する必芁がありたす。 --informat , 〜のように
--informat ストックホルム (実装における珟圚の制限のため、MSA ファむル
巻き戻し䞍可胜な入力ストリヌムでは圢匏を自動怜出できたせん。)

じゃないかもしれない '-' (暙準出力)、 CM ファむルを送信するため、 (Linuxで蚀うずころのstdout 衝突するだろう
プログラムの他のテキスト出力ず組み合わせたす。

CMを曞くこずに加えお、 、 cmビルド それぞれに察しお単䞀行も出力したす
モデルは暙準出力に䜜成されたす。 各行には次のフィヌルドがありたす: "aln":
CM の構築に䜿甚されるアラむメント。 "idx": CM のむンデックス ; "名前"
CMの名前。 「nseq」: CM を構築するために䜿甚されるアラむメント内の配列の数。
「eff_nseq」: モデルの構築に䜿甚されるシヌケンスの有効数。 「アレン」: 長さ
CM の構築に䜿甚されるアラむメント。 "clen": アラむメントの列数
コンセンサス (䞀臎) 列ずしお定矩されたす。 「bps」: CM 内の塩基察の数。 "bif":
CM 内の分岐の数。 "rel entropy: CM": の合蚈盞察゚ントロピヌ
モデルをコンセンサス列の数で割ったもの。 "rel entropy: HMM": 盞察的な合蚈
二次構造を無芖したモデルの゚ントロピヌをコンセンサスの数で割った倀
列。 「説明」: モデル/アラむメントの説明。

OPTIONS


-h ヘルプ; コマンドラむンの䜿甚法ず利甚可胜なオプションの簡単なリマむンダヌを出力したす。

-n 新しいCMの名前を教えおください 。 デフォルトでは、線圢の名前が䜿甚されたす(線圢の名前が䜿甚されおいる堎合)。
に存圚する 、 たたは、それができない堎合は、 。 If
耇数のアラむメントが含たれおおり、 -n 機胜しない、そしおすべおの調敎
に泚釈が付けられた名前が必芁です (ストックホルム #=GF ID 泚釈ず同様)。

-F 次を蚱可したす。 䞊曞きされたす。 このオプションを䜿甚しない堎合、 既に
存圚し、 cmビルド ゚ラヌで終了したす。

-o 抂芁出力をファむルに送信したす 、 むしろ stdout。

-O 各モデルを構築した埌、泚釈付きの゜ヌス アラむメントをファむルに再保存したす。
ストックホルム圢匏。 シヌケンスには、盞察的なシヌケンスの重みが泚釈ずしお付けられたす。
が割り圓おられたした。 線圢には参照泚釈線の泚釈も付けられたす
どの列がコンセンサスずしお割り圓おられたかを瀺したす。 ゜ヌスのアラむメントに
参照アノテヌション (「#=GC RF」) は、次のコンセンサス残基に眮き換えられたす。
コンセンサス列のモデルず「.」 挿入列の堎合、 - 手
オプションはコンセンサスポゞションを指定するために䜿甚されたした。この堎合、それは
倉曎なし。

--devhelp ず同様に、ヘルプを印刷したす -h , ただし、そうでない゚キスパヌト オプションも含たれたす。
で衚瀺される -h . これらの専門家向けオプションは、
倧倚数のナヌザヌが䜿甚するため、マニュアル ペヌゞには説明されおいたせん。 唯䞀の
実際に䜕をするのかを理解するためのリ゜ヌスは、短い XNUMX 行です。
説明が出力される堎合 --devhelp が有効になっおいお、゜ヌスコヌドが有効になっおいたす。

OPTIONS 制埡 MODEL 建おる


これらのオプションは、アラむメント内でコンセンサス列を定矩する方法を制埡したす。

- 速い コンセンサス列を分数 >= を持぀列ずしお自動的に定矩したす。 シンフラック of
ギャップではなく残留物。 (詳现に぀いおは以䞋を参照しおください) --symfrac オプションです。これは、
デフォルト。

- 手 参照座暙の泚釈 (#=GC RF ラむン、ストックホルム) を䜿甚しお、どの䜍眮にあるかを決定したす。
列はコンセンサスであり、列は挿入です。 ギャップ以倖の文字は、
コンセンサス欄。 (たずえば、コンセンサス列を「x」でマヌクし、列を挿入したす)
"." を付けおください。) このオプションが呌び出されたした。 --rf Infernal の以前のバヌゞョン (0.1
1.0.2 たで。

--symfrac
次の堎合にコンセンサス列を定矩するために必芁な残基画分しきい倀を定矩したす。
䜿甚しおいない - 手。 デフォルトは 0.5 です。 各列の蚘号分数は次のずおりです。
盞察的なシヌケンスの重み付けを考慮した埌に蚈算されたす。 これを次のように蚭定するず、
0.0 は、すべおの配眮列がコンセンサスずしお割り圓おられるこずを意味したす。
堎合によっおは圹に立ちたす。 1.0 に蚭定するず、ギャップが 0 ぀含たれる列のみが察象になりたす。
コンセンサスずしお割り圓おられたす。 このオプションは、 --ギャップスレシュ オプション
Infernal の以前のバヌゞョン (0.1  1.0.2) から、 (1.0 - に等しい)
。 たずえば、次のコマンドの動䜜を再珟するには、 cmビルド --ギャップスレシュ 0.8
以前のバヌゞョンでは、䜿甚したす cmビルド --symfrac 0.2 このバヌゞョンでは。

--ノス 二次構造の泚釈がある堎合でも無芖したす。 そしおCMを構築したす
れロ塩基察。 このモデルはプロファむル HMM に䌌おおり、 cmsearch &
cmスキャン プログラムは、このために CM アルゎリズムよりも高速な HMM アルゎリズムを䜿甚したす。
モデル。 さらに、れロ塩基察モデルは次の方法で校正する必芁はありたせん。 cmキャリブレヌション
走る前に cmsearch それず。 ザ・ --ノス オプションがない堎合は、このオプションを䜿甚する必芁がありたす
二次構造の泚釈 。

--研究
ファむル内の RIBOSUM マトリックスを䜿甚しお、RSEARCH のように排出スコアをパラメヌタ化したす。 。
--研究 有効、すべおの䜍眮合わせ 必ず XNUMX ぀を含める必芁がありたす
シヌケンスたたは - 電話 オプションも有効にする必芁がありたす。 各シヌケンス内のすべおの䜍眮
コンセンサス「列」ずみなされたす。 実際、これらの排出スコアは
モデリングの違いにより、モデルは RIBOSUM スコアず同䞀ではありたせん
Infernal ず RSEARCH の戊略は異なりたすが、可胜な限り䌌たものになりたす。
RIBOSUM マトリックス ファむルは、Infernal の "matrices/" サブディレクトリに含たれおいたす。
最䞊䜍の「infernal-xxx」ディレクトリ。 RIBOSUM行列は眮換スコアです
独立した䞀本鎖を持぀構造 RNA 甚に特別にトレヌニングされたマトリックス
残基および塩基察の眮換スコア。 詳现に぀いおは、「研究」を参照しおください。
出版物Klein and Eddy、BMC Bioinformatics 4:44、2003。

その他 MODEL 建おる OPTIONS


- ヌル
null モデルをから読み取る 。 ヌル モデルは各 RNA の確率を定矩したす。
バックグラりンド配列のヌクレオチドの堎合、デフォルトでは各ヌクレオチドに 0.25 を䜿甚したす。
Null ファむルの圢匏はナヌザヌ ガむドに指定されおいたす。

- 前
事前にディリクレを読んでください 、 デフォルトの混合ディリクレを眮き換えたす。 の
以前のファむルの圢匏はナヌザヌ ガむドに指定されおいたす。

  --devhelp 文曞化されおいない远加のモデル構築オプションを確認したす。

OPTIONS 制埡 盞察 WEIGHTS


cmビルド アドホックシヌケンス重み付けアルゎリズムを䜿甚しお、密接に関連する重み付けを軜枛したす
シヌケンスず遠関連のものをアップりェむトしたす。 これにより、モデルの数が少なくなる効果がありたす。
䞍均䞀な系統的衚珟によっお偏っおいる。 たずえば、XNUMX ぀の同䞀のシヌケンスは次のようになりたす。
通垞、それぞれは XNUMX ぀のシヌケンスの半分の重みを受け取りたす。 これらのオプションは制埡したす
どのアルゎリズムが䜿甚されるか。

--wpb Henikoff 䜍眮ベヌスのシヌケンス重み付けスキヌムを䜿甚したす [Henikoff および Henikoff、
 バむオル。 243:574、1994]。 これがデフォルトです。

--wgsc 重み付けアルゎリズムを䜿甚するら、
バむオル。 235:1067、1994]。

--wone
シヌケンスの重み付けをオフにしたす。 たずえば、すべおのシヌケンスの重みを明瀺的に 1.0 に蚭定したす。

--w 䞎えられた
入力アラむメント ファむルの泚釈に指定されおいるシヌケンスの重みを䜿甚したす。 いいえの堎合
重みが䞎えられおおり、それらがすべお 1.0 であるず仮定したす。 デフォルトでは、新しいものを決定したす。
Gerstein/Sonnhammer/Chothia アルゎリズムによるシヌケンスの重み付け。
泚釈付きの重み。

--wblosum
デフォルトの代わりに BLOSUM フィルタリング アルゎリズムを䜿甚しおシヌケンスに重み付けを行いたす。
GSC の重み付け。 指定された同䞀性パヌセントで配列をクラスタヌ化したす (「 --wid);
各クラスタヌに合蚈 1.0 の重みを割り圓お、メンバヌ間で均等に分散したす。
そのクラスタヌの。

--幅
の動䜜を制埡したす --wblosum パヌセントを蚭定するこずによる重み付けオプション
アラむメントをクラスタリングするための ID 。

OPTIONS 制埡 効果的な シヌケンス 数


盞察的な重みが決定された埌、合蚈が有効になるように正芏化されたす。
シヌケンス番号、 eff_nseq。 この数は、実際のシヌケンスの数である可胜性がありたす。
しかし、ほずんどの堎合、それよりも小さくなりたす。 デフォルトの゚ントロピヌ重み付け
方法 (--ent) 有効なシヌケンス番号を枛らしお情報コンテンツを削枛したす。
コンセンサス䜍眮ごずの盞察゚ントロピヌ、たたは真のホモログの平均期埅スコア。 の
タヌゲットの盞察゚ントロピヌは XNUMX ぀のパラメヌタヌ関数によっお制埡されたす。
パラメヌタは次のように蚭定できたす --えれ & --゚シグマ。

--ent ゚ントロピヌ重み付け戊略を䜿甚しお、有効なシヌケンス番号を決定したす。
タヌゲットの平均䞀臎状態の盞察゚ントロピヌを䞎えたす。 このオプションはデフォルトであり、
でオフにするこずができたす --゚ノン。 デフォルトのタヌゲット平均䞀臎状態盞察倀
゚ントロピヌは、少なくずも 0.59 ぀のベヌスペアを持぀モデルの堎合は 1 ビット、モデルの堎合は 0.38 ビットです。
塩基察はれロですが、倉曎されたした ――えっず。 デフォルトの 0.59 ビットたたは 0.38 ビットは、
モデルの盞察゚ントロピヌの合蚈 (合蚈が䞀臎する堎合) は自動的に倉曎されたす。
状態盞察゚ントロピヌ) はカットオフ (デフォルトでは 6.0 ビット) 未満ですが、
専門家に盞談すれば倉曎可胜、文曞化されおいない - 元 オプション。 本圓にそうしたいなら
そのオプションを詊しお、゜ヌス コヌドを参照しおください。

--゚ノン
゚ントロピヌ重み付け戊略をオフにしたす。 有効なシヌケンス番号は、
アラむメント内のシヌケンスの数。

--えれ
タヌゲットの平均䞀臎状態の盞察゚ントロピヌを次のように蚭定したす。 。 デフォルトではタヌゲットは
少なくずも 0.59 のモデルの堎合、䞀臎䜍眮ごずの盞察゚ントロピヌは 1 ビットです。
ベヌスペアがれロのモデルの堎合は 0.38。

--゚ミンセク
最小蚱容有効シヌケンス番号を次のように定矩したす。 。

--うヌん
タヌゲット HMM 平均䞀臎状態盞察゚ントロピヌを次のように蚭定したす。 。 の゚ントロピヌ
塩基察の䞀臎状態は、限界化された塩基察発光を䜿甚しお蚈算されたす。
確率。

--eset
゚ントロピヌ重み付けのための有効なシヌケンス番号を次のように蚭定したす。 。

OPTIONS 制埡 フィルタ P7 HMM 建おる


それぞれのCMに察しお、 cmビルド を構築するず、付随するフィルタヌ p7 HMM が入力から構築されたす。
アラむメントも同様に。 これらのオプションは、フィルタヌ HMM の構築を制埡したす。

--p7ere
フィルタヌ p7 HMM のタヌゲット平均䞀臎状態盞察゚ントロピヌを次のように蚭定したす。 。 By
デフォルトでは、䞀臎䜍眮ごずのタヌゲット盞察゚ントロピヌは 0.38 ビットです。

--p7ml CM から構築された最尀 p7 HMM をフィルタヌ HMM ずしお䜿甚したす。 この HMM は、
CM にできるだけ䌌おいるこず (ただし、二次的なものは必然的に無芖されたす)
構造。

  --devhelp 文曞化されおいない远加のフィルタヌ HMM 構築オプションを確認したす。

OPTIONS 制埡 フィルタ P7 HMM 范正


各フィルタHMMを構築した埌、 cmビルド 䜿甚する適切な E 倀パラメヌタを決定したす
フィルタリング䞭に cmsearch & cmスキャン シヌケンスのセットをサンプリングしお怜玢するこずによっお
各 HMM フィルタヌ構成ずアルゎリズムを䜿甚したす。

--EmN ロヌカル MSV フィルタヌ HMM キャリブレヌションのサンプル シヌケンスの数を に蚭定したす。 。
デフォルトでは200。

--EvN ロヌカル ビタビ フィルタヌ HMM キャリブレヌションのサンプル シヌケンスの数を に蚭定したす。
。 デフォルトでは200。

--゚ルフN ロヌカル フォワヌド フィルタヌ HMM キャリブレヌションのサンプリング シヌケンスの数を に蚭定したす。
。 デフォルトでは200。

--EgfN グロヌカル前方フィルタヌ HMM キャリブレヌション甚のサンプリングされたシヌケンスの数を蚭定したす
〜ぞ 。 デフォルトでは200。

  --devhelp 文曞化されおいない远加のフィルタヌ HMM キャリブレヌション オプションを確認したす。

OPTIONS FOR 粟補 ザ 入力 調敎


- リファむン
CM を構築する前に、期埅倀を䜿甚しお調敎を調敎しおみたす。
最倧化EM。 CM は、通垞どおり、最初に初期調敎から構築されたす。 それから、
アラむンメント内のシヌケンスは最適に再調敎されたす (HMM バンド付き CYK を䜿甚)
アルゎリズム、最適ずは、垯域が䞎えられた堎合に最適であるこずを意味したすを CM に適甚し、新しい CM が構築されたす
結果のアラむメントから。 その埌、シヌケンスは新しい CM に合わせお再調敎され、
新しい CM はその調敎から構築されたす。 これを収束するたで続けるず、
特に、連続する XNUMX ぀の反埩の䜍眮合わせが正しくない堎合に発生したす。
倧幅に異なりたすすべおのシヌケンスの合蚈ビットスコア
連続する 1 回の反埩間でのアラむメントの倉化は XNUMX% 未満です)。 最終
アラむメント (曞き蟌たれる CM を構築するために䜿甚されるアラむメント)  is
に曞き蟌た 。

-l - リファむン、 ロヌカル アラむメント アルゎリズムをオンにするず、アラむメントが可胜になりたす。
必芁に応じお XNUMX ぀以䞊のサブシヌケンスにたたがる (ク゚リの構造が異なる堎合など)
モデルずタヌゲット配列は郚分的にのみ共有されたす、特定の倧きな
構造内の挿入ず削陀には通垞ずは異なるペナルティが適甚されたす
むンデル。 デフォルトでは、ク゚リ モデルをタヌゲット シヌケンスにグロヌバルに調敎したす。

--ギブス
の動䜜を倉曎したす - リファむン そのため、EM の代わりに Gibbs サンプリングが䜿甚されたす。 の
違いは、調敎段階では必ずしも調敎が行われるわけではないこずです。
最適ではなく、各シヌケンスのアラむンメント (パヌスツリヌ) が
Inside アルゎリズムによっお決定されたアラむメントの事埌分垃。 により
このサンプリングステップ --ギブス は非決定的であるため、同じものでも異なる実行が行われたす。
䜍眮合わせを行うず異なる結果が生じる可胜性がありたす。 これは圓おはたらない堎合 - リファむン 䜿甚されおいる
なしで --ギブス オプション。この堎合、最終的なアラむメントず CM は垞に
同じ。 い぀ --ギブス が有効になっおいる堎合、 - シヌド オプションを䜿甚しお、
乱数を予枬どおりに生成し、結果を再珟可胜にしたす。 の目暙
  --ギブス オプションは、RNA アラむメントの専門家キュレヌタヌが構造を改良するのを支揎するこずです
代替の高埗点アラむメントを芳察できるようにするこずで、アラむメントを向䞊させたす。

- シヌド
乱数ゞェネレヌタに次のシヌドを䞎えたす 、 æ•Žæ•° >= 0。このオプションで指定できるのは
ず組み合わせお䜿甚​​されたす --ギブス。 If れロ以倖の確率的サンプリングです
アラむメントは再珟可胜です。 同じコマンドでは同じ結果が埗られたす。 もしも
が 0 の堎合、乱数ゞェネレヌタヌは任意にシヌドされ、確率的です。
サンプリングは、同じコマンドの実行ごずに異なる堎合がありたす。 デフォルトのシヌドは 0 です。

--サむク - リファむン、 CYKアルゎリズムず䞀臎したす。 デフォルトでは最適な粟床
ずいうアルゎリズムが䜿われおいたす。 これに぀いおの詳现は、 cmalign マニュアルペヌゞ。

--notrunc
- リファむン、 切り詰められた䜍眮合わせアルゎリズムをオフにしたす。 もっずある
これに関する情報は、 cmalign マニュアルペヌゞ。

  --devhelp 文曞化されおいない远加の䜍眮合わせ調敎オプションを確認するには、
その他の出力ファむル オプションや、単䞀のモデルに察しお耇数のモデルを構築するためのオプションも含たれたす。
アラむメント。

onworks.net サヌビスを䜿甚しおオンラむンで cmbuild を䜿甚する


無料のサヌバヌずワヌクステヌション

Windows ず Linux のアプリをダりンロヌド

Linuxコマンド

Ad