IngleseFranceseTedescoItalianoPortogheseRussianSpagnolo

Favicon di OnWorks

map2slimp - Online nel cloud

Esegui map2slimp nel provider di hosting gratuito OnWorks su Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

Questo è il comando map2slimp che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici postazioni di lavoro online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

PROGRAMMA:

NOME


map2slim - mappa le associazioni dei geni in un'ontologia 'sottile'

SINOSSI


cd vai
map2slim GO_slims/goslim_generic.obo ontology/gene_ontology.obo gene-associations/gene_association.fb

DESCRIZIONE


Dato un file GO slim e un'ontologia corrente (in uno o più file), questo script verrà mappato
un file di associazione genica (contenente annotazioni al GO completo) ai termini nel GO
sottile.

Lo script può essere utilizzato per creare un nuovo file di associazione genica, contenente il più
pertinenti accessioni GO slim, o in modalità conteggio, nel qual caso darà gene distinto
il prodotto conta per ogni termine sottile

Il formato del file di associazione è descritto qui:

<http://www.geneontology.org/GO.annotation.shtml#file>

ARGOMENTI


-b benna sottile filetto
Questo argomento aggiunge benna condizioni all'ontologia sottile; vedere la documentazione qui sotto per
una spiegazione. Verrà scritto il nuovo file di ontologia sottile, inclusi i termini del bucket
benna sottile filetto

-outmap sottile mappatura filetto
Questo genererà un file di mappatura per ogni termine nell'ontologia completa che mostra sia il
termine sottile più pertinente e tutti i termini sottili che sono antenati. Se usi questo
opzione, NON fornire un file di associazioni genetiche

nomi degli spettacoli
(Funziona solo con -outmap)

Mostra i nomi del termine nel file di mappatura sottile

-c Questo forzerà map2slim a fornire i conteggi del file assoc, piuttosto che mapparlo

-t Se usato insieme a -c tabula l'output in modo che il rientro rifletta
la gerarchia ad albero nel file sottile

-o su filetto
Questo scriverà gli assoc (o conteggi) mappati nel file specificato, piuttosto che in
lo schermo

SCARICA


Questo script fa parte di go-perl pacchetto, disponibile da CPAN

<http://search.cpan.org/~cmungall/go-perl/>

Questo script non funzionerà senza installare go-perl

MAPPATURA ALGORITMO
GO è un DAG, non un albero. Ciò significa che spesso c'è più di un percorso da un termine GO
fino al nodo radice Gene_Ontology; il percorso può intersecare più termini nello slim
ontologia - il che significa che un'annotazione può essere mappata su più termini sottili!

(Nota devi vederlo online per vedere l'immagine qui sotto - se non lo stai visualizzando su
le http://www.geneontology.org sito, puoi guardare il seguente URL:
<http://geneontology.cvs.sourceforge.net/*checkout*/geneontology/go-dev/go-perl/doc/map2slim.gif>
)

Un esempio ipotetico: i cerchi blu mostrano i termini nel GO slim e i cerchi gialli mostrano
termini nell'ontologia completa. L'ontologia completa sussume il sottile, quindi i termini blu sono
anche nell'ontologia.

VAI ID MAPPE PER SLIM ID TUTTI GLI ANTENATI SLIM
===== =============== ==================
5 2 + 3 2,3,1
6 3 solo 3,1
7 4 solo 4,3,1
8 3 solo 3,1
9 4 solo 4,3,1
10 2 + 3 2,3,1

La seconda colonna mostra gli ID più pertinenti nella mappatura diretta sottile. Il 2°
la colonna mostra tutti gli antenati nella slim.

Nota in particolare la mappatura dell'ID 9 sebbene questo abbia due percorsi per la radice attraverso
il sottile via 3 e 4, 3 viene scartato perché sussunto da 4.

D'altra parte, 10 mappa sia su 2 che su 3 perché questi sono entrambi i primi ID slim nel
due percorsi validi alla radice e nessuno dei due sussume l'altro.

L'algoritmo utilizzato è:

per mappare un qualsiasi termine nell'ontologia completa: trova tutti i percorsi validi fino al nodo radice in
l'ontologia completa

per ogni percorso, prendi il primo termine sottile incontrato nel percorso

scartare tutti i termini ridotti ridondanti in questo set, ad esempio i termini sottili sussunti da altri termini ridotti
nel set

SECCHIO TERMINI
Se esegui lo script con l'opzione -b, verranno aggiunti i termini del bucket. Per ogni termine P in
il sottile, se P ha almeno un figlio C, verrà creato un termine bucket P' sotto P. Questo è
un termine generico per mappare qualsiasi termine nell'ontologia completa che è un discendente di P, ma
NON un discendente di alcun figlio di P nell'ontologia sottile.

Ad esempio, lo slim generic.0208 ha i seguenti termini e struttura:

%Legame al DNA ; VAI:0003677
% di legame alla cromatina ; VAI:0003682
% di attività del fattore di trascrizione ; VAI:0003700, VAI:0000130

Dopo aver aggiunto i termini del bucket, sarà simile a questo:

%Legame al DNA ; VAI:0003677
% di legame alla cromatina ; VAI:0003682
% di attività del fattore di trascrizione ; VAI:0003700 ; sinonimo:GO:0000130
@bucket: associazione Z-ALTRO-DNA; slim_temp_id:12

Termini dell'ontologia completa che sono altri figli del legame al DNA, come single-
il legame del DNA a filamento e i suoi discendenti verranno mappati al termine bucket.

Il termine bucket ha un ID sottile che è transitorio ed è lì solo per facilitare il
Mappatura. Non deve essere utilizzato esternamente.

Il termine bucket ha il prefisso Z-OTHER; la Z è un trucco per assicurarsi che il termine sia
elencato sempre per ultimo nell'ordine alfabetico.

L'algoritmo viene leggermente modificato se vengono utilizzati i termini del bucket. Il termine secchio ha an
relazione implicita con tutti gli ALTRI fratelli non magri.

Do I bisogno benna termini?

Al giorno d'oggi la maggior parte dei file sottili sono completamente o quasi 'completi', cioè non ci sono spazi vuoti.
Ciò significa che l'opzione -b non produrrà risultati diversi evidenti. Per esempio,
potresti vedere un termine bucket OTHER-binding creato, senza alcuna annotazione: perché all
i figli di rilegatura nel GO sono rappresentati nel file sottile.

L'opzione bucket è davvero necessaria solo per alcuni dei file slim archiviati più vecchi,
che sono statici e sono stati generati in modo abbastanza ad-hoc; tendono ad accumulare "lacune"
nel tempo (ad esempio GO aggiungerà un nuovo figlio di associazione, ma il file slim statico non sarà all'altezza
data, quindi tutti i prodotti genici annotati con questo nuovo termine verranno mappati al legame ALTRO nel
sottile)

GRAFICO ERRORI
Si noti che i file di ontologia sottile potrebbero essere obsoleti rispetto all'attuale
ontologia.

Attualmente map2slim non segnala le discrepanze tra il grafico sottile e il grafico in
il file ontologia completo; prende l'ontologia completa come il grafo reale. in ogni caso, il
l'ontologia sottile verrà utilizzata per formattare i risultati se si seleziona -t -c come opzioni.

USCITA
In modalità normale, verrà scritto un file di associazione genica in formato standard. La colonna GO ID
(5) conterrà ID slim GO. La mappatura corrisponde alla 2a colonna della tabella
sopra. Nota che il file di output può contenere più righe del file di input. Questo è
perché alcuni ID GO completi hanno più di un ID slim pertinente.

COUNT MODE

map2slim può essere eseguito con l'opzione -c, che fornirà i conteggi di geni distinti
prodotti mappati a ciascun termine sottile. Le colonne sono le seguenti

GO Termine
La prima colonna è l'ID GO seguito dal nome del termine (il nome del termine è fornito come
si trova sia nelle ontologie full GO che slim - di solito sono le stesse
ma a volte il file slim resterà indietro rispetto alle modifiche nel file GO)

Conteggio dei prodotti genici per i quali questo è il termine sottile più rilevante
il numero di prodotti genici distinti per i quali questo è il più pertinente/diretto slim
ID. Per più diretto intendiamo che o l'associazione è fatta direttamente a questo termine,
OPPURE l'associazione è fatta a un bambino di questo termine magro E non c'è nessun bambino magro
termine a cui si associa l'associazione.

Per la maggior parte dei slim, questo conteggio sarà equivalente al numero di associazioni direttamente
mappato a questo sottile termine. Tuttavia, alcuni file slim più vecchi sono "imprevedibili" in quanto
ammettere "lacune". Ad esempio, se il magro ha tutti i figli del "processo biologico" con
l'eccezione di "comportamento" allora tutte le annotazioni su "comportamento" o sui suoi figli saranno
contato qui

vedi esempio sotto

Conteggio dei prodotti genici dedotti essere associati al termine sottile
e il numero di prodotti genici distinti che sono annotati a qualsiasi discendente di questo
ID slim (o annotato direttamente sull'ID slim).

bandiera di obsolezione
VAI ontologia

Per fare un esempio; se usiamo -t e -c in questo modo:

map2slim -t -c GO_slims/goslim_generic.obo ontology/gene_ontology.obo gene-associations/gene_association.fb

Quindi parte dei risultati potrebbe assomigliare a questo:

GO:0008150 processo_biologico (processo_biologico) 34 10025 processo_biologico
GO:0007610 comportamento (comportamento) 632 632 processo_biologico
GO:0000004 processo biologico sconosciuto (processo biologico sconosciuto) 832 832 processo_biologico
GO:0007154 comunicazione cellulare (comunicazione cellulare) 333 1701 processo_biologico
GO:0008037 riconoscimento cellulare (riconoscimento cellulare) 19 19 processo_biologico
19 prodotti sono stati mappati su GO:0008037 o su uno dei suoi figli. (GO:0008037 è un nodo foglia nello slim, quindi i due conteggi sono identici).

D'altra parte, GO:0008150 ottiene solo 34 prodotti per i quali questo è il più rilevante
termine. Questo perché la maggior parte delle annotazioni verrebbe mappata a qualche figlio di GO:0008150 nel sottile,
come GO:0007610 (comportamento). Questi 34 prodotti genici sono annotati direttamente in
GO:0008150, oa qualche figlio di questo termine che non è magro. Questo può indicare
'lacune' nel sottile. Nota che l'esecuzione di map2slim con l'opzione -b "coprirà" queste lacune
con termini di riempimento artificiale.

Usa map2slimp online utilizzando i servizi onworks.net


Ad


Ad

Gli ultimi programmi online per Linux e Windows