これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド proda です。
プログラム:
NAME
proda - 反復と再配列を含むタンパク質配列の多重アラインメント
SYNOPSIS
プロダ [オプション] [mfaファイル] [> 出力]
DESCRIPTION
このマニュアルページでは、 プロダ
プロダ (Protein Domain Aligner) は、複数のドメインを生成するためのパブリックドメインのソフトウェアです。
反復および再配列を伴うタンパク質配列のアラインメント、たとえば、
複数のドメイン。
タンパク質配列のセットを入力として与えると、ProDA はまず局所的なペアワイズ アライメントを見つけます。
すべての配列ペア間で整列可能な配列フラグメントのブロックを形成し、
最後にブロックの複数のアライメントを生成します。 ProDA は使用される多くのテクニックに依存しています
in プロブコン (<http://probcons.stanford.edu>)、高い効果を示す最近のマルチプル アライナー
多くの一般的なベンチマークにおける精度。
入力 FORMAT
Proda は、MFA 形式の入力ファイルを受け入れます。 MFA 形式は以下で指定されます。
· MFA フォーマットは複数のシーケンスで構成されます。
· MFA 形式の各シーケンスは XNUMX 行の説明で始まり、その後に続きます。
シーケンスデータの行。
· 説明行は、大なり記号 (">") によってシーケンス データと区別されます。
最初の列の記号。
出力 FORMAT
一連の入力シーケンスに対して、Proda は通常、いくつかのブロックを順番に出力します。
整列可能な配列フラグメント。 各ブロックの後には複数のアライメントが続きます。
ブロックは、その配列フラグメントをリストすることによって指定されます。 各フラグメントは次のように出力されます。
sequence_name(start-end)、sequence_name は元のシーケンスの名前、
start と end は、それぞれフラグメントの開始位置と終了位置です。
Proda は、以下に説明する ClustalW (ALN) 形式でブロック アライメントを生成します。
· ClustalW 形式は、単一のヘッダー行とそれに続くシーケンス データで構成されます。
50 個の位置合わせ位置のブロック。
· 各ブロックは次のもので構成されます。
· アラインメント内の各配列の XNUMX 行のデータ - 特に、
シーケンスの名前。
· 50 文字の配置。
· 完全に保存された (*)、強く保存された (:)、または
弱く保存された列 (.);
· 説明行は、大なり記号 (">") によってシーケンス データと区別されます。
最初の列の記号。
ファスタ 形式でアーカイブしたプロジェクトを保存します. の 出力
-fasta オプションが指定されている場合、ProDA は通常の出力に加えて、
FASTA 形式のブロック アライメントを含むファイル。 出力ファイルの名前は次のとおりです。
最初の入力ファイルと拡張子は「.fasta」です。 XNUMX つの連続するブロック アライメントは次のとおりです。
文字「#」を含む行で区切られます。
FASTA 形式については以下で説明します。
· FASTA 形式は、入力ファイルで指定されたすべてのシーケンスで構成されます。
· FASTA 形式の各シーケンスは XNUMX 行の説明で始まり、その後に続きます。
シーケンスデータの行。
· 説明行は、大なり記号 (">") によってシーケンス データと区別されます。
最初の列の記号。
· 整列された残基は大文字で示され、整列されていない残基は小文字で示されます。
最終的なアライメントには各シーケンスが XNUMX 回だけ含まれるため、このオプションは XNUMX 回のみ使用する必要があります。
入力シーケンスに繰り返しが含まれていない場合。
OPTIONS
-L [最小の長さ]
最小のアライメント長を [min_length] に設定します。
ProDA は、しきい値 L 以上の長さのアライメントを見つけます。
デフォルトでは、L = 30。このオプションは、しきい値を [min_length] に設定します。
-後部
ローカルのペアワイズ アラインメントを計算する場合は、事後復号化を使用します。
ProDA は、ペア HMM を使用して XNUMX つのシーケンス間のローカルなペアワイズ アラインメントを計算します。
ビタビ復号化または事後復号化のいずれか。 デフォルトのオプションは使用しています
ビタビ復号は事後復号より高速ですが、精度が低くなる可能性があります。
このオプションをオンにすると、代わりに事後デコーディングを使用するようにアライナーに指示されます。 の
上の例では、出力は -posterior オプションをオンにして生成されました。
-サイレント
調整中は進捗状況を報告しないでください。
このオプションをオンにすると、アライナーは作業中に進行状況を報告しないよう指示されます。
整列中。 デフォルトでは、ProDA はすべてのペアワイズ アラインメントの進行状況を報告します。
生成、およびブロックのアライメントについて。 特にアルゴリズムのいくつかの段階では、
ペアごとのアライメント、時間がかかる場合があります。進捗状況を報告すると、プログラムの見た目が変わります。
走りながら生きている。
-トラン
整列可能な配列フラグメントのブロックを形成するときに推移性を使用します。
XNUMX つの配列フラグメントは、ローカル配列の一部である場合、直接整列可能です。
ペアワイズアライメント。 デフォルトでは、XNUMX つのフラグメントは次の場合にのみ整列可能であるとみなされます。
直接整列可能な場合。 このオプションをオンにすると、アライナーに次のことが指示されます。
XNUMX つのフラグメントが直接整列可能な場合、または両方のフラグメントが整列可能であるとみなします。
それらは XNUMX 番目のフラグメントに直接整列可能です。
-ファスト
ClustalW 形式に加えて FASTA 出力形式を使用します。
このオプションをオンにすると、アライナーは FASTA 形式で出力を生成します。
最初の入力ファイルと同じ名前と拡張子のファイルに保存します
標準出力への通常の出力に加えて、「.fasta」。 このオプションを使用する必要があります
入力シーケンスに繰り返しが含まれていない場合のみ。
onworks.net サービスを使用してオンラインで proda を使用する