英語フランス語スペイン語

Ad


OnWorksファビコン

map2slimp-クラウドでのオンライン

Ubuntu Online、Fedora Online、Windows Onlineエミュレーター、またはMACOSオンラインエミュレーターを介してOnWorks無料ホスティングプロバイダーでmap2slimpを実行します

これは、Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、MACOSオンラインエミュレーターなどの複数の無料オンラインワークステーションの2つを使用してOnWorks無料ホスティングプロバイダーで実行できるコマンドmapXNUMXslimpです。

プログラム:

NAME


map2slim-遺伝子の関連付けを「スリムな」オントロジーにマップします

SYNOPSIS


CDゴー
map2slim GO_slims / goslim_generic.obo ontology / gene_ontology.obo gene-associations / gene_association.fb

DESCRIPTION


GOスリムファイルと現在のオントロジー(XNUMXつ以上のファイル)が与えられると、このスクリプトはマップされます
GO内の用語への遺伝子関連ファイル(完全なGOへの注釈を含む)
スリム。

このスクリプトを使用して、ほとんどの遺伝子を含む新しい遺伝子関連ファイルを作成できます。
適切なGOスリムアクセッション、またはカウントモードの場合、それは明確な遺伝子を与えます
各スリムタームの製品数

アソシエーションファイルの形式については、次のとおりです。

<http://www.geneontology.org/GO.annotation.shtml#file>

議論


-b バケット スリム file
この引数は追加します バケット 条件 スリムなオントロジーに。 以下のドキュメントを参照してください
説明。 バケット用語を含む新しいスリムオントロジーファイルは、
バケット スリム file

-アウトマップ スリム マッピング file
これにより、完全なオントロジーのすべての用語のマッピングファイルが生成され、両方が表示されます。
最も適切なスリムな用語と祖先であるすべてのスリムな用語。 これを使用する場合
オプション、遺伝子関連ファイルを提供しないでください

ショーネーム
(-outmapでのみ機能します)

スリムマッピングファイルに用語の名前を表示する

-cこれにより、map2slimは、マップするのではなく、assocファイルのカウントを強制的に与えます。

-tと組み合わせて使用​​する場合 -c インデントが反映されるように出力をタブ化します
スリムファイルのツリー階層

-o でる file
これにより、マップされた関連(またはカウント)が、指定されたファイルではなく、指定されたファイルに書き込まれます。
スクリーン

DOWNLOAD


このスクリプトは、 ゴーパール パッケージ、CPANから入手可能

<http://search.cpan.org/~cmungall/go-perl/>

このスクリプトは、go-perlをインストールしないと機能しません

MAPPING アルゴリズム
GOはDAGであり、ツリーではありません。 これは、GO用語から複数のパスが存在することが多いことを意味します
ルートGene_Ontologyノードまで。 パスはスリムで複数の用語と交差する可能性があります
オントロジー-これは、XNUMXつの注釈が複数のスリムな用語にマップできることを意味します!

(注意 下の画像を表示するには、これをオンラインで表示する必要があります-これを表示していない場合
  http://www.geneontology.org サイトでは、次のURLを見ることができます。
<http://geneontology.cvs.sourceforge.net/*チェックアウト*/geneontology/go-dev/go-perl/doc/map2slim.gif>
)

架空の例の青い円はGOスリムの用語を示し、黄色の円は
完全なオントロジーの用語。 完全なオントロジーはスリムを包含しているので、青い用語は
オントロジーでも。

IDマップをスリムIDに移動すべてのスリムな祖先
===== =============== =================
5 2 + 3 2,3,1
6のみ3
7のみ4
8のみ3
9のみ4
10 2 + 3 2,3,1

2番目の列は、スリムダイレクトマッピングで最も適切なIDを示しています。 3番目
列には、スリムのすべての祖先が表示されます。

特にID9のマッピングに注意してください。ただし、これにはルートへのXNUMXつのパスがあります。
スリムビア3と4、3は4に含まれているため、破棄されます。

一方、10は2と3の両方にマップされます。これは、これらが両方とも最初のスリムIDであるためです。
ルートへのXNUMXつの有効なパスであり、どちらももう一方を包含しません。

使用されるアルゴリズムは次のとおりです。

完全なオントロジーの任意のXNUMXつの用語をマップするには:ルートノードまでのすべての有効なパスを検索します。
完全なオントロジー

パスごとに、パスで最初に出会ったスリムな用語を使用します

このセット内の冗長なスリムな用語、つまり他のスリムな用語に含まれるスリムな用語を破棄します
セットで

バケツ 条件
-bオプションを指定してスクリプトを実行すると、バケット用語が追加されます。 任意の用語についてP
スリムで、Pに少なくともXNUMXつの子Cがある場合、バケット項P'がPの下に作成されます。これは
Pの子孫である完全なオントロジーの任意の用語をマッピングするための包括的な用語ですが、
スリムオントロジーのPの子の子孫ではありません。

たとえば、slimgeneric.0208の用語と構造は次のとおりです。

%DNA結合; GO:0003677
%クロマチン結合; GO:0003682
%転写因子活性; GO:0003700、GO:0000130

バケット用語を追加すると、次のようになります。

%DNA結合; GO:0003677
%クロマチン結合; GO:0003682
%転写因子活性; GO:0003700; 同義語:GO:0000130
@bucket:Z-OTHER-DNA結合; Slim_temp_id:12

単一のDNA結合など、DNA結合の他の子である完全なオントロジーからの用語
鎖状DNA結合とその子孫は、バケット用語にマッピングされます。

バケット用語には、一時的なスリムIDがあり、
マッピング。 外部で使用しないでください。

バケット用語には接頭辞Z-OTHERがあります。 Zは、用語が
常にアルファベット順で最後にリストされます。

バケット用語が使用されている場合、アルゴリズムはわずかに変更されます。 バケット用語には
スリムではない他のすべての兄弟との暗黙の関係。

Do I 必要 バケット 条項?

現在、ほとんどのスリムファイルは完全にまたはほぼ「完全」です。つまり、ギャップはありません。
これは、-bオプションが目立った異なる結果を生成しないことを意味します。 例えば、
バケット用語のOTHERバインディングが作成され、注釈が付けられていない場合があります。
GOでのバインディングの子は、スリムファイルで表されます。

バケットオプションは、実際には、アーカイブされた古いスリムファイルの一部にのみ必要です。
これらは静的であり、かなりアドホックな方法で生成されました。 それらは「ギャップ」を蓄積する傾向があります
時間の経過とともに(たとえば、GOはバインディングの新しい子を追加しますが、静的スリムファイルは最大になりません
したがって、この新しい用語に注釈が付けられた遺伝子産物は、
スリム)

グラフ 不一致
スリムなオントロジーファイルは、現在のファイルに対して古くなっている可能性があることに注意してください
オントロジー。

現在、map2slimは、スリムグラフとのグラフの間のグラフの不一致にフラグを立てません。
完全なオントロジーファイル。 完全なオントロジーが実際のグラフであると見なされます。 しかし
選択した場合、スリムオントロジーが結果のフォーマットに使用されます -t -c オプションとして。

出力
通常モードでは、標準形式の遺伝子関連ファイルが書き込まれます。 GOID列
(5)GOスリムIDが含まれます。 マッピングは、テーブルの2番目の列に対応します
その上。 出力ファイルには、入力ファイルよりも多くの行が含まれる場合があることに注意してください。 これは
一部の完全なGOIDには、複数の適切なスリムIDがあるためです。

COUNT モード

map2slimは-cオプションを指定して実行できます。これにより、個別の遺伝子の数がわかります。
各スリム用語にマッピングされた製品。 列は次のとおりです

GOターム
最初の列はGOIDで、その後に用語名が続きます(用語名は次のように提供されます)。
それは完全なGOとスリムなオントロジーの両方に見られます-これらは通常同じです
ただし、スリムファイルがGOファイルの変更に遅れをとる場合があります)

これが最も関連性の高いスリムな用語である遺伝子産物の数
これが最も適切/直接スリムである別個の遺伝子産物の数
ID。 最も直接的とは、この用語に直接関連付けられていることを意味します。
または、このスリムな用語の子に関連付けが行われ、スリムな子はありません
アソシエーションがマップする用語。

ほとんどのスリムの場合、この数は直接関連付けの数に相当します
このスリムな用語にマッピングされます。 ただし、一部の古いスリムファイルは、「むらがある」という点で「むら」があります。
「ギャップ」を認めます。 たとえば、スリムに「生物学的プロセス」のすべての子がいる場合
「behavior」を除いて、「behavior」またはその子へのすべての注釈は次のようになります。
ここで数えます

以下の例を参照してください

スリムタームに関連すると推定される遺伝子産物の数
そして、この子孫に注釈が付けられた別個の遺伝子産物の数
スリムID(またはスリムIDに直接注釈を付けます)。

廃止フラグ
GOオントロジー

例を挙げると、 このように-tと-cを使用すると、次のようになります。

map2slim -t -c GO_slims / goslim_generic.obo ontology / gene_ontology.obo gene-associations / gene_association.fb

その場合、結果の一部は次のようになります。

GO:0008150 Biological_process(biological_process)34 10025 Biological_process
GO:0007610動作(動作)632 632 bio_process
GO:0000004生物学的プロセス不明(生物学的プロセス不明)832 832 bio_process
GO:0007154細胞間情報伝達(細胞間情報伝達)333 1701 bio_process
GO:0008037細胞認識(細胞認識)19 19 bio_process
19の製品がGO:0008037またはその子の0008037つにマッピングされました。 (GO:XNUMXはスリムのリーフノードであるため、XNUMXつのカウントは同じです)。

一方、GO:0008150は、これが最も関連性の高い34の製品しか取得しません。
学期。 これは、ほとんどの注釈がスリムなGO:0008150の子にマップされるためです。
GO:0007610(動作)など。 これらの34の遺伝子産物は、直接注釈が付けられています。
GO:0008150、またはスリムではないこの用語の子供に。 これは指すことができます
スリムの「ギャップ」。 -bオプションを指定してmap2slimを実行すると、これらのギャップが「埋められる」ことに注意してください。
人工的なフィラー用語で。

onworks.netサービスを使用してmap2slimpをオンラインで使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

Linuxコマンド

Ad