これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド exonerate-server です。
プログラム:
NAME
exonerate-server - exonerate の配列比較サーバー
SYNOPSIS
免罪サーバー [ オプション ] <インデックス パス>
DESCRIPTION
免罪サーバー exonerate シーケンス アライメント プログラム用のマルチスレッド サーバーです。
シーケンスのセットと対応するインデックス ファイルを使用して、大規模なデータセットの高速化を可能にします。
概要
まず、 .esd ファイルはシーケンス ファイルから作成する必要があります。 の .esd ファイルは無罪です
シーケンス データセット ファイルであり、各シーケンスの任意のセットをグループ化するために使用できます。
一意の識別子を含むシーケンス。 これは、 ファスタ2esd ユーティリティ。
ファスタ2esd ゲノム.ファスタ ゲノム.esd
次に、 .esi ファイルはから作成されます .esd ファイル。 ザ .esi ファイルは無罪シーケンスです
インデックス ファイル。特定のデータセットに対応するインデックスまたはインデックスのセットが含まれます。
これは、 esd2esi ユーティリティ。
esd2esi ゲノム.esd ゲノム.esi
一度 .esi ファイルが生成されると、exonerate-server が起動される可能性があります。
免罪サーバー ゲノム.esi
サーバーの実行中に、exonerate を使用してサーバーにクエリを実行できます。
コマンドラインでサーバーの名前とポート番号を使用してターゲットシーケンスを指定します。 の
exonerate-server のデフォルトのポート番号は 12886 です。
謝罪する クエリ.fasta localhost:12886
OPTIONS
exonerate-server のコマンド ライン オプションの一部は、
クライアントの容疑を晴らし、これらはマニュアルページに文書化されています。 無罪を晴らす。
に固有のその他のオプション 免罪サーバー ここに文書化されています。
- 港
サーバーがリッスンするポートを指定します。 デフォルトでは、 免罪サーバー
はポート 12886 で待機しますが、このオプションで代替ポートを指定できます。
- 入力 <インデックス ファイル>
サーバー起動時に使用するインデックスファイルを指定します。 このオプションは
必須。 インデックスファイルは、 .esi によって生成されたファイル esd2esi ユーティリティ。
-プリロード
デフォルトでは、 .esi ファイル、およびそこで参照されるシーケンス
対応する .esd ファイルはサーバーの起動時にメモリにロードされます。
これは、高速なパフォーマンスを達成するために必要です。そうでなければ、
頻繁なディスクアクセス。 このオプションにより、インデックスとシーケンスのプリロードが可能になります。
オフにすると、サーバーの実行速度は大幅に遅くなりますが、速度は速くなります。
起動時のメモリ使用量が少なくなります。 プリロードをオフにすることはお勧めできません
サーバーのテストまたはデバッグを除く。
--maxconnections
サーバーはマルチスレッドです。 このオプションは、クライアントがプロセスする数を設定します。
同時にサーバーに接続することができます。 優れたパフォーマンスを実現するには、
を実行するマシン上の CPU の数を超える値に設定しないでください。
サーバーが実行されています。
-冗長性
サーバーの冗長レベルを設定します。 ゼロの場合、サーバーは沈黙します。
数値が大きいほど、サーバーによって報告されるメッセージの内容が多くなります。
起こっている。
INTERFACE
このセクションでは、次の間の通信インターフェイスについて説明します。
クライアントとサーバー。 インターフェースは、これから書きたい人のために文書化されています。
exonerate の背後に配置する独自のカスタム サーバー - exonerate の通常の使用では、
これを知る必要はありません。
このインターフェースは、クライアントが単純なコマンドラインを送信し、サーバーが送信することによって機能します。
ソケットを介した単純な応答行。 すべてのコマンドと応答は単純な ASCII 行です。
テキストなので、サーバーをテストするためのクライアントとして Telnet を使用できます。
どのコマンドも XNUMX 行のテキストですが、応答には複数行のテキストが含まれる場合があります。 の
返信は次の形式です :
どの返信にもタグ付きの行を含めることができます 警告: or エラー: ボーマン 警告: & エラー: タグ
はクライアントによってエコーされ、クライアントは何らかのメッセージを受信すると終了します。 エラー: 応答。
サーバーが複数行の応答を返す場合、最初の行には応答の数を表示する必要があります。
返信全体の行は次のようになります。 行数: 例については、からの返信を参照してください。 取得する
HSP 以下のセッション例のコマンド。
クライアントは、マルチスレッドであっても、サーバーに対して XNUMX つの接続のみを開きます。
複数のクライアントが同時に接続できるようにするには、明らかにサーバーが必要です。
コマンド & 返信 中古 in for インタフェース。
コマンド: バージョン
返信: バージョン
コマンド: 終了する
返信: (応答なし - サーバーは接続を閉じます)
コマンド: データベース情報
返信: dbinfo:
データベース情報 このコマンドは、サーバーにロードされているデータベースに関する情報を返します。
返されるフィールドは次のとおりです。
DNAかタンパク質のどちらか
ソフトマスクまたはマスク解除のいずれか
データベース内の配列の数
データベース内の最も長いシーケンスの長さ
データベース内のすべてのシーケンスの合計長
コマンド: 検索
返信: 検索:
lookup コマンドは、外部識別子を内部識別子にマップするために使用されます。
識別子。
コマンド: 取得する info
返信: seqinfo: [ 】
get info コマンドは、データベース内のシーケンスに関する情報を返します。 の
返されるフィールドは次のとおりです。
シーケンスの長さ
gcg 形式のチェックサム (以下を参照)
外部 ID (例: fasta ヘッダーから)
シーケンスの説明行 (これも fasta からのもの)
ヘッダー)、このフィールドはオプションであり、省略できます。
コマンド: 取得する seq
返信: シーケンス:
get seq コマンドは、シーケンス全体を XNUMX 行で返します。
コマンド: 取得する サブシーケンス
返信: 後続:
get subseq コマンドはシーケンスの一部を返します。 シーケンスの始まりは、
位置ゼロ。 例えば。 get subseq 0 0 10 は、最初の 10 塩基を返します。
データベース内の最初のシーケンス。
コマンド: セッションに クエリー
返信: わかりました:
seq query コマンドは、クエリ シーケンスをサーバーに送信するために使用されます。 それ
シーケンスの長さと gcg チェックサムを返します。
コマンド: 回転圧縮
返信: わかりました: ストランド
revcomp query コマンドは、サーバーにクエリを逆補完させます。 これ
クエリを XNUMX 回送信する帯域幅を節約するためです。
revcomp target コマンドは、データベースをそのデータベースとして扱うようにサーバーに指示します。
逆補完。 クライアントは、検索する場合にのみこのコマンドを送信します。
翻訳されたデータベースなので、ほとんどの種類の検索では実装する必要はありません。
コマンド: セッションに パラメータ
返信: わかりました:
setparameterコマンドは、exonerateコマンドラインからパラメータを送信します。
サーバー。 基本的なコマンドの場合、クライアントはこのコマンドをすべて無視できます。
実装されていますが、最適なパフォーマンスを得るには無視できません。
コマンド: 取得する HSP
返信: hspset: { }
または: hspset: 空
get hsps コマンドは、hsps のセットを取得するためのメイン コマンドです。 サーバー
複数の hspset を返す場合があります。 返されるフィールドは次のとおりです。
これらの HSPset のターゲット シーケンスの内部 ID。
HSPクエリの開始位置
HSP ターゲットの開始位置
HSPの長さ
最後の XNUMX つのフィールドは HSP を表し、XNUMX つのフィールドで何度も繰り返される場合があります。
hspset: 返信ライン。
A シンプルな 例 クライアント ダイアログ。
%telnet localhost 12886
127.0.0.1 を試しています...
localhost.localdomain に接続されました。
エスケープ文字は「^]」です。
% バージョン
バージョン: exonerate-server 2.0.0
% データベース情報
dbinfo: DNA ソフトマスク 100000 1701 38113579
% ルックアップ AA159529.1
ルックアップ: 88065
% 情報を取得 88065
seqinfo: 62 2028 AA159529.1 zo72g05.s1 Stratagene pancreas (#937208) ホモサピエンス cDNA
% シーケンス 88065 を取得
シーケンス: NAACTCATCNTTTTCTGCTGNATCCTCTTCACCAGTTTGGGGGANGGCCTGCACTTCCANAG
% サブシーケンスを取得 88065 10 20
サブシーケンス: TTTTCTGCTGNATCCTCTTC
% クエリを設定します NAACTCATCNTTTTCTGCTGNATCCTCTTCACCAGTTTGGGGGANGGCCTGCACTTCCANAG
OK: 62 2028
% が HSP になる
行数: 15
hspset: 12423 1 349 41
hspset: 44900 1 356 47
hspset: 61781 1 358 41 36 392 26
hspset: 70065 1 349 41 36 383 26
hspset: 88065 1 1 61
hspset: 91032 1 357 41 36 391 26
hspset: 91442 1 350 41 36 384 26
hspset: 92971 1 348 41 36 382 26
hspset: 94311 1 375 41
hspset: 95381 1 346 41 36 380 26
hspset: 96808 10 385 32 36 410 26
hspset: 88449 18 11 22
hspset: 91036 6 6 56
hspset: 93736 36 400 26
%revcompクエリ
ok: クエリ ストランド revcomp
% が HSP になる
行数: 6
hspset: 12564 0 64 26 20 83 41
hspset: 61780 0 266 61
hspset: 29148 0 116 61
hspset: 25849 15 445 22
hspset: 93938 26 265 34
% 出口
接続は外部ホストによって閉じられました。
ENVIRONMENT
まだ文書化されていません。
例
1. 翻訳されたインデックスを作成し、次を使用して高速プロテイン 2 ゲノム検索を実行する例
免罪サーバー
ファスタ2esd human.genomic.fasta human.genomic.esd esd2esi --翻訳はい human.genomic.esd
ヒトゲノムトランスESI 免罪サーバー --ポート 1234 human.genomic.trans.esi 謝罪する
pep.fasta localhost:1234 --model p2g --seedrepeat 3 --geneseed 250
VERSION
このドキュメントは、exonerateパッケージのバージョン2.2.0に付属しています。
onworks.net サービスを使用してオンラインで exonerate-server を使用する