Aceasta este comanda map2slimp care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
map2slim - mapează asociațiile genelor la o ontologie „subțire”.
REZUMAT
cd merge
map2slim GO_slims/goslim_generic.obo ontology/gene_ontology.obo gene-associations/gene_association.fb
DESCRIERE
Având în vedere un fișier GO slim și o ontologie curentă (în unul sau mai multe fișiere), acest script se va mapa
un fișier de asociere a genelor (conținând adnotări la GO complet) la termenii din GO
subţire.
Scriptul poate fi folosit fie pentru a crea un nou fișier de asociere a genelor, care conține cel mai mult
accesările GO slim pertinente, sau în modul de numărare, caz în care va da genă distinctă
produsul contează pentru fiecare termen subțire
Formatul fișierului de asociere este descris aici:
<http://www.geneontology.org/GO.annotation.shtml#fișier>
ARGUMENTE
-b găleată subţire fişier
Acest argument adaugă găleată termeni la ontologia slim; consultați documentația de mai jos pentru
o explicatie. Noul fișier de ontologie subțire, inclusiv termenii compartimentului va fi scris în
găleată subţire fişier
-outmap subţire cartografiere fişier
Aceasta va genera un fișier de mapare pentru fiecare termen din ontologia completă, arătând atât
cel mai pertinent termen slim și toți termenii slim care sunt strămoși. Daca folosesti asta
opțiunea, NU furnizați un fișier de asociații de gene
nume de prezentare
(Funcționează numai cu -outmap)
Afișați numele termenului în fișierul de mapare subțire
-c Acest lucru va forța map2slim să dea contorizări ale fișierului assoc, mai degrabă decât să îl mapeze
-t Când este utilizat împreună cu -c va tabula ieșirea astfel încât indentarea să se reflecte
ierarhia arborelui din fișierul slim
-o afară fişier
Aceasta va scrie asociațiile mapate (sau numărările) în fișierul specificat, mai degrabă decât în
Monitorul
DOWNLOAD
Acest script face parte din go-perl pachet, disponibil de la CPAN
<http://search.cpan.org/~cmungall/go-perl/>
Acest script nu va funcționa fără instalarea go-perl
CARTOGRAFIERE ALGORITM
GO este un DAG, nu un copac. Aceasta înseamnă că există adesea mai multe căi de la un termen GO
până la nodul rădăcină Gene_Ontology; calea poate intersecta mai mulți termeni în slim
ontologie - ceea ce înseamnă că o adnotare se poate mapa la mai mulți termeni subțiri!
(nota trebuie să vedeți acest lucru online pentru a vedea imaginea de mai jos - dacă nu o vizualizați pe
il http://www.geneontology.org site-ul, vă puteți uita la următoarea adresă URL:
<http://geneontology.cvs.sourceforge.net/*checkout*/geneontology/go-dev/go-perl/doc/map2slim.gif>
)
Un exemplu ipotetic, cercurile albastre arată termenii din GO slim, iar cercurile galbene
termeni din ontologia completă. Ontologia completă subsumează slim, deci termenii albaștri sunt
de asemenea în ontologie.
GO ID HĂRȚI PENTRU SLIM ID TOȚI Strămoșii SLIM
===== =============== ==================
5 2+3 2,3,1
6 3 numai 3,1
7 4 numai 4,3,1
8 3 numai 3,1
9 4 numai 4,3,1
10 2+3 2,3,1
A doua coloană arată cele mai pertinente ID-uri din maparea directă subțire. Al 2-lea
coloana arată toți strămoșii în slim.
Rețineți în special maparea ID-ului 9, deși acesta are două căi către rădăcină
slim via 3 și 4, 3 este aruncat deoarece este subsumat de 4.
Pe de altă parte, 10 hărți atât la 2, cât și la 3, deoarece acestea sunt ambele primul ID subțire din
două căi valide către rădăcină și niciuna nu o subsumează pe cealaltă.
Algoritmul folosit este:
pentru a mapa orice termen din ontologia completă: găsiți toate căile valide către nodul rădăcină în
ontologia completă
pentru fiecare cale, luați primul termen subțire întâlnit în cale
eliminați orice termeni subțiri redundanți din acest set, adică termeni subțiri subsumați de alți termeni subțiri
în decor
GĂLEATĂ TERMENI
Dacă rulați scriptul cu opțiunea -b, vor fi adăugați termeni de grup. Pentru orice termen P în
cel subțire, dacă P are cel puțin un copil C, un termen de găleată P' va fi creat sub P. Acesta este
un termen general pentru maparea oricărui termen din ontologia completă care este un descendent al lui P, dar
NU un descendent al vreunui copil al lui P în ontologia subțire.
De exemplu, genericul slim.0208 are următorii termeni și structură:
% de legare la ADN; GO:0003677
% legarea cromatinei; GO:0003682
% activitate factor de transcripție ; GO:0003700, GO:0000130
După adăugarea termenilor de grup, va arăta astfel:
% de legare la ADN; GO:0003677
% legarea cromatinei; GO:0003682
% activitate factor de transcripție ; GO:0003700; sinonim:GO:0000130
@bucket: legarea Z-ALT-ADN ; slim_temp_id:12
Termeni din ontologia completă care sunt alți copii ai legării ADN-ului, cum ar fi un singur
legarea ADN-ului catenar și descendenții săi se vor mapa la termenul de găleată.
Termenul de găleată are un ID subțire care este tranzitorie și este acolo doar pentru a facilita
cartografiere. Nu trebuie folosit extern.
Termenul găleată are prefixul Z-ALTLU; Z este un hack pentru a vă asigura că termenul este
enumerate întotdeauna ultimul în ordinea alfabetică.
Algoritmul este ușor modificat dacă sunt utilizați termeni de grup. Termenul găleată are un
relație implicită cu toți ceilalți frați care nu sunt în slim.
Do I nevoie găleată termeni?
În zilele noastre, cele mai multe fișiere subțiri sunt în întregime sau aproape „complete”, adică nu există lacune.
Aceasta înseamnă că opțiunea -b nu va produce rezultate diferite vizibile. De exemplu,
este posibil să vedeți un termen de găleată OTHER-binding creat, fără nicio adnotare: deoarece toate
copiii de legare în GO sunt reprezentați în fișierul slim.
Opțiunea găleată este într-adevăr necesară doar pentru unele dintre fișierele subțiri mai vechi arhivate,
care sunt statice și au fost generate într-un mod destul de ad-hoc; au tendința să acumuleze „lacune”
de-a lungul timpului (de exemplu, GO va adăuga un nou copil de legare, dar fișierul subțire static nu va fi de până la
data, astfel încât orice produse genetice adnotate la acest nou termen se vor mapa la OTHER-binding în
subţire)
GRAFIC RĂSPUNSURI
Rețineți că fișierele de ontologie subțire pot fi învechite în raport cu cele curente
ontologie.
În prezent, map2slim nu semnalează nepotrivirile grafice dintre graficul subțire și graficul din interior
fișierul complet de ontologie; ia ontologia completă ca fiind graficul real. Însă
Ontologia subțire va fi utilizată pentru a formata rezultatele dacă selectați -t -c ca opțiuni.
REZULTATE
În modul normal, va fi scris un fișier de asociere a genelor în format standard. Coloana GO ID
(5) va conține ID-uri GO slim. Maparea corespunde celei de-a doua coloane din tabel
de mai sus. Rețineți că fișierul de ieșire poate conține mai multe linii decât fișierul de intrare. Aceasta este
deoarece unele ID-uri complete GO au mai multe ID-uri subțiri pertinente.
COUNT MODE
map2slim poate fi rulat cu opțiunea -c, care va oferi numărul de gene distincte
produse mapate pentru fiecare termen subțire. Coloanele sunt după cum urmează
GO Termen
Prima coloană este ID-ul GO urmat de numele termenului (numele termenului este furnizat ca
se găsește atât în ontologiile complete GO, cât și în cele subțiri - acestea vor fi de obicei aceleași
dar ocazional fișierul subțire va rămâne în urmă modificărilor din fișierul GO)
Numărul de produse genetice pentru care acesta este cel mai relevant termen subțire
numărul de produse genetice distincte pentru care acesta este cel mai pertinent/direct slim
ID. Prin cea mai directă înțelegem că fie asocierea se face direct la acest termen,
SAU asocierea se face unui copil cu acest termen slim SI nu exista copil slim
termenul căruia asociația se mapează.
Pentru majoritatea slims, acest număr va fi echivalent cu numărul de asociații direct
mapat la acest termen subțire. Cu toate acestea, unele fișiere mai vechi subțiri sunt „pete” prin aceea că ele
admite „lacune”. De exemplu, dacă slim are toți copiii de „proces biologic” cu
cu excepția „comportamentului”, atunci toate adnotările la „comportament” sau copiii acestuia vor fi
numărat aici
vezi exemplul de mai jos
Numărul de produse genetice deduse a fi asociat cu termenul subțire
și numărul de produse genetice distincte care sunt adnotate oricărui descendent al acestuia
slim ID (sau adnotat direct la slim ID).
steag de uzură
GO ontologie
Ca să luăm un exemplu; dacă folosim -t și -c astfel:
map2slim -t -c GO_slims/goslim_generic.obo ontology/gene_ontology.obo gene-associations/gene_association.fb
Atunci o parte din rezultate poate arăta astfel:
GO:0008150 biological_process (biological_process) 34 10025 biological_process
GO:0007610 comportament (comportament) 632 632 biological_process
GO:0000004 proces biologic necunoscut (proces biologic necunoscut) 832 832 biological_process
GO:0007154 comunicare celulară (comunicare celulară) 333 1701 proces_biologic
GO:0008037 recunoaștere celulară (recunoaștere celulară) 19 19 biological_process
19 produse au fost mapate către GO:0008037 sau unul dintre copiii acestuia. (GO:0008037 este un nod frunză în slim, deci cele două numărări sunt identice).
Pe de altă parte, GO:0008150 primește doar 34 de produse pentru care acesta este cel mai relevant
termen. Acest lucru se datorează faptului că majoritatea adnotărilor s-ar mapa la un copil al GO:0008150 în slim,
cum ar fi GO:0007610 (comportament). Aceste 34 de produse genetice sunt fie adnotate direct la
GO:0008150, sau unui copil cu acest termen care nu este în slim. Acest lucru poate indica
„goluri” în slim. Rețineți că rularea map2slim cu opțiunea -b va „astupa” aceste lacune
cu termeni de umplere artificială.
Utilizați map2slimp online folosind serviciile onworks.net