これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド alistat です。
プログラム:
NAME
alistat - マルチアライメントファイルの統計を表示します
SYNOPSIS
アリスタット [オプション] アラインファイル
DESCRIPTION
アリスタット ファイルから複数の配列アライメントを読み取ります アラインファイル サポートされているものであればどれでも
形式 (SELEX、GCG MSF、および CLUSTAL を含む) に基づいて、多数の単純な統計を表示します。
それについて。 これらの統計には、フォーマットの名前、シーケンスの数、
残基の総数、配列長の平均と範囲、アラインメント
長さ (ギャップ文字を含むなど)。
数パーセントの同一性も示されています。 パーセントペアワイズアライメント同一性が定義されます
as (識別子 / MIN(len1, レン2)) コラボレー ID は正確なアイデンティティの数であり、 len1、
len2 は、XNUMX つのシーケンスのアライメントされていない長さです。 「平均同一性パーセント」、「最も
アライメントの「関連するペア」および「最も無関係なペア」は、平均、最大、および
それぞれ、すべての (N)(N-1)/2 ペアの最小値。 「最も遠い配列」は次のように計算されます。
すべての N 配列の最大のペアごとの同一性 (最良の相対的) を見つけてから、
これらの N 個の数値の最小値 (したがって、最も外れているシーケンス)。
OPTIONS
-a 追加の詳細情報を表示: シーケンスごとに XNUMX 行の表が表示されます。
名前、長さ、およびペアごとの最高値と最低値。 これらの行は、
簡単に有効にするために * 文字を接頭辞として付けます grep'それらを取り出して並べ替えます。
たとえば、 アリスタット -a foo.slx | grep * | sort -n +3 のランク付けされたリストを提供します
アライメント内の最も遠い配列。 と互換性がありません -f オプションを選択します。
-f 速い; サンプリング方法を使用して平均 %id を推定します。 このオプションがオンの場合、
選ばれた、 アリスタット 他の XNUMX つのペアごとの識別番号は表示されません。 これ
このオプションは、完全な (N)(N-1) 計算が必要となる非常に大規模なアライメントに役立ちます。
すべてのペアの数は法外です (例: Pfam の GP120 アラインメント、10,000 以上
シーケンス)。 と互換性がありません -a オプションを選択します。
-h 簡単なヘルプを印刷します。 バージョン番号とすべてのオプションの概要が含まれます。
エキスパートのオプション。
-q be Quiet - 冗長なヘッダー (プログラム名、リリース番号、日付、
有効なパラメータとオプション)。
-B (バベルフィッシュ)。 デフォルト以外のシーケンスファイル形式を自動検出して読み取る
(ファスタ)。 ほとんどすべての一般的なシーケンス ファイル形式が認識されます (Genbank、
EMBL、SWISS-PROT、PIR、および GCG アンアライン配列フォーマット、およびストックホルム、GCG MSF、
クラスタアライメント形式)。 完全なリストについては、印刷されたドキュメントを参照してください。
サポートされている形式。
EXPERT OPTIONS
--informat
シーケンス ファイルの形式を指定します。 、 デフォルトの FASTA ではなく
フォーマット。 一般的な例には、Genbank、EMBL、GCG、PIR、ストックホルム、クラスタル、MSF、
またはフィリップ。 受け入れられる形式の完全なリストについては、印刷されたドキュメントを参照してください。
名前。 このオプションはデフォルトの形式 (FASTA) をオーバーライドし、 -B バベルフィッシュ
自動検出オプション。
onworks.net サービスを使用してオンラインで alistat を使用する