英語フランス語スペイン語

Ad


OnWorksファビコン

2番目のスコア

Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、またはMACOSオンラインエミュレーターを介してOnWorks無料ホスティングプロバイダーで2ndscoreを実行します

これは、Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、MACOSオンラインエミュレーターなどの複数の無料オンラインワークステーションの2つを使用してOnWorks無料ホスティングプロバイダーで実行できるコマンドXNUMXndscoreです。

プログラム:

NAME


2ndscore-各位置に固定された最適なヘアピンを見つけます。

SYNOPSIS


2ndscore in.fasta> out.hairpins

DESCRIPTION


シーケンス内のすべての位置について、これは次の行を出力します。

-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(スコア)(開始..終了)(左コンテキスト)(ヘアピン)(右コンテンツ)

シーケンスの終わり近くの位置の場合、コンテキストは「x」で埋めることができます
文字。 ヘアピンが見つからない場合、スコアは「なし」になります。

複数のfastaファイルを指定でき、各fastaファイルに複数のシーケンスを含めることができます。 The
各シーケンスの出力は、「>」で始まり、
シーケンスのFASTA記述。

プラスストランドとマイナスストランドのヘアピンスコアが異なる場合があるため(GUのため)
RNAでの結合)、デフォルトでは、2ndscoreはすべてのシーケンスに対してXNUMXセットのヘアピンを出力します。
フォワードヘアピンとリバースヘアピン。 すべてのフォワードヘアピンが最初に出力され、
は、その前の「>」行の最後に「FORWARD」という単語を付けることで識別されます。
同様に、REVERSEヘアピンは、「REVERSE」で終わる「>」行の後にリストされます。 もし、あんたが
どちらか一方のストランドのみを検索する場合は、次を使用できます。

--no-fwdFORWARDヘアピンを印刷しないでください
--no-rvsREVERSEヘアピンを印刷しないでください

--gc、-au、-gu、
--mm、-gapオプション。 --min-loop、-max-loop、および--max-lenオプションもサポートされています。

FORMAT OF 。バッグ ファイル
.bagファイルの列は次のとおりです。

1.遺伝子名
2.terminator_start
3.terminator_end
4.hairpin_score
5. テールスコア
6.terminator_sequence

7. terminator_confidence:ヘアピンとテールスコアの組み合わせ
そのようなスコアがランダムな順序である可能性を考慮に入れます。 この
ターミネータの主な「スコア」であり、次のように計算されます。
紙。

8. APPROXIMATE_distance_from_end_of_gene:*概算*の塩基数
遺伝子の終わりとターミネーターの始まりの間のペア。 この
いくつかの点で概算です。まず、(そして最も重要な)TransTermHP
常に実際の遺伝子の終わりを使用するとは限りません。 あなたが与えるオプションに応じて
遺伝子の末端を切り取って、ターミネーターを処理する場合があります。
遺伝子と部分的に重複しています。 第二に、ターミネーターが「始まる」場所
明確に定義されていません。 このフィールドは、健全性チェックのみを目的としています
(遺伝子の終わり近くで最良であると報告されているターミネーターは、
遺伝子の終わりから_遠すぎる_)。

使用する トランターム WITHOUT ゲノム 注釈
TransTermHPは、既知の遺伝子情報を3つの目的にのみ使用します。(1)推定値にタグを付ける
「遺伝子内」または「遺伝子間」としてのターミネーター、(2)バックグラウンドGCの選択-
遺伝子はGC含量が異なることが多いため、スコアを計算するための含量パーセンテージ
遺伝子間領域よりも、(3)わずかに読みやすい出力を生成します。 項目(1)
(3)本当に必要ではなく、(2)あなたの遺伝子がほぼ同じである場合は効果がありません
遺伝子間領域としてのGCコンテンツ。

残念ながら、TransTermHPには、アノテーションなしで実行するための簡単なオプションがまだありません。
ファイル(.pttまたは.coordsのいずれか)であり、少なくとも2つの遺伝子が存在する必要があります。 ソリューション
各染色体に隣接する偽の小さな遺伝子を作成することです。 これを行うには、fake.coordsを作成します
次のXNUMX行のみを含むファイル:

fakegene1 1 2 chome_id
fakegene2 L-1 L chrom_id

ここで、Lは入力シーケンスの長さであり、L-1は入力の長さより1短いです。
順序。 「chrom_id」は、.fastaファイルの「>」の直後の単語である必要があります
シーケンスが含まれています。 (たとえば、.fastaファイルが "> seq1"で始まっている場合、
chrom_id = seq1)。

これにより、1つのXNUMX塩基長の遺伝子が配列に隣接する「偽の」注釈が作成されます。
テールツーテール配置:-> <-。 TransTermHPは、次のコマンドで実行できます。

transterm -p expterm.dat sequence.fasta fake.coords

遺伝子間領域のG / C含有量が遺伝子とほぼ同じである場合、これは
ターミネーターが受け取るスコアにはあまり影響しません。 一方で、
TransTermHPのこの使用法はほとんどテストされていないため、その使用を保証することは困難です。
正確さ。

onworks.netサービスを使用してオンラインで2ndscoreを使用する


Ad