これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、MAC OS オンライン エミュレーターなど、複数の無料オンライン ワークステーションのいずれかを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド bp_unflatten_seqp です。
プログラム:
NAME
bp_unflatten_seq - genbank または genbank スタイルの機能ファイルをネストされたものに非平坦化します
SeqFeature 階層
SYNOPSIS
bp_un flatten_seq.PLS -e 3 -gff ~/cvs/bioperl-live/t/data/AE003644_Adh-genomic.gb
bp_unflatten_seq.PLS --詳細 ~/cvs/bioperl-live/t/data/AE003644_Adh-genomic.gb
bp_unflatten_seq.PLS -i foo.embl --embl から --chadoxml へ -o out.chado.xml
bp_un flatten_seq.PLS --notypemap --detail --asciitree -ethresh 2 AE003644_Adh-genomic.gb
DESCRIPTION
このスクリプトは 平らにしない ネストされた SeqFeatures の genbank または genbank スタイルのファイル
階層。
Bio::SeqFeature::Tools::Unflattener を参照してください
GenBank/EMBL 表現では、機能は「フラット」です。たとえば、リンクはありません。
mRNA と CDS の間、暗黙のリンク以外 (タグ経由またはスプライス サイト経由など)
これはコーディングが難しい場合があります。
これは、デフォルトの出力形式で最も簡単に説明できます。 アスキーツリー
フラット化されていない genbank 機能セットは次のようになります (AB077698)
配列番号: AB077698
データバンク_エントリ 1..2701[+]
遺伝子
mRNA
CDS hCHCR-G 80..1144[+]
エクソン80..1144[+]
Five_prime_UTR 1..79[+]
位置シーケンス機能 137..196[+]
位置シーケンス機能 239..292[+]
位置シーケンス機能 617..676[+]
位置シーケンス機能 725..778[+]
スリープライム_UTR 1145..2659[+]
ポリA_サイト 1606..1606[+]
ポリA_サイト 2660..2660[+]
または、このように (AE003734 の一部)
遺伝子
mRNA CG3320-RA
CDS CG3320-PA 53126..54971[-]
エクソン52204..53323[-]
エクソン53404..53631[-]
エクソン53688..53735[-]
エクソン53798..53918[-]
エクソン54949..55287[-]
mRNA CG3320-RB
CDS CG3320-PB 53383..54971[-]
エクソン52204..53631[-]
エクソン53688..53735[-]
エクソン53798..53918[-]
エクソン54949..55287[-]
非平坦化は、包含階層も「正規化」します (という意味で)
標準化 - たとえば、genbank であっても、常にトランスクリプト レコードがあることを確認します。
CDSと遺伝子を指定するだけです)
デフォルトでは、GenBank タイプは SO タイプにマッピングされます
Bio::SeqFeature::Tools::TypeMapper を参照してください。
COMMAND LINE 議論
-i|入力ファイル
入力ファイル (最後の引数としても指定可能)
-フォーマットから
入力形式 (デフォルトは genbank)
これを非フラット形式に使用するのはおそらくあまり意味がありません。 つまり、それ以外
エンブレム/ゲンバンク
-フォーマットへ
出力形式 (デフォルトは asciitree)
実際には、ネストされた SeqFeature 対応の形式である必要があります。 これだけだと思う
asciitree、chadoxml、gff3
-gff
GFF3 フォーマットへのエクスポート (3 以前の GFF は、フラット化されていないシーケンスでは意味がありません。
特徴グラフを表現するための決まった方法はありません)
-o|出力ファイル
出力ファイルのデフォルトは STDOUT
-詳細
機能の詳細を表示 (asciitree モードのみ)
-e|ethresh INT
非平坦化のエラーしきい値を設定します
デフォルトでは、このスクリプトは、genbank で奇妙なものに遭遇するとぐらつきをスローします。
file - エラーしきい値を上げて、これらを無視するように通知します (および報告されます)。
標準エラー)
-ノマジック
unflattening で use_magic を抑制 (Bio::SeqFeature::Tools::Unflattener を参照)
-notypemap
型マッピングを抑制します (Bio::SeqFeature::Tools::TypeMapper を参照)
すべて
Bio::SeqFeature::Tools::Unflattener により、非平坦化をきめ細かく制御できます
プロセス - コマンドラインでこの制御を許可するには、さらにオプションを追加する必要があります
フィードバック
郵送 リスト
ユーザーフィードバックは、このモジュールおよび他のBioperlモジュールの進化の不可欠な部分です。 送信
できればBioperlメーリングリストへのコメントや提案。 あなたの参加
非常に高く評価されています。
bioperl-l@bioperl.org - 一般的なディスカッション
http://bioperl.org/wiki/Mailing_lists -メーリングリストについて
各種レポート作成 バグ
バグをBioperlバグ追跡システムに報告して、バグとそのバグを追跡できるようにします。
解決。 バグレポートは電子メールまたは Web 経由で送信できます。
https://github.com/bioperl/bioperl-live/issues
onworks.net サービスを使用してオンラインで bp_unflatten_seqp を使用する