AnglaisFrançaisEspagnol

Ad


Icône de favori OnWorks

map2slimp - En ligne dans le Cloud

Exécutez map2slimp dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande map2slimp qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


map2slim - mappe les associations de gènes sur une ontologie « slim »

SYNOPSIS


cd aller
map2slim GO_slims/goslim_generic.obo ontologie/gene_ontology.obo gene-associations/gene_association.fb

DESCRIPTION


Étant donné un fichier GO slim et une ontologie actuelle (dans un ou plusieurs fichiers), ce script mappera
un fichier d'association de gènes (contenant des annotations au GO complet) aux termes du GO
maigrir.

Le script peut être utilisé pour créer un nouveau fichier d'association de gènes, contenant le plus
des accessions GO slim pertinentes, ou en mode comptage, auquel cas il donnera un gène distinct
le produit compte pour chaque terme mince

Le format du fichier d'association est décrit ici :

<http://www.geneontology.org/GO.annotation.shtml#fichier>

ARGUMENTS


-b seau svelte filet
Cet argument ajoute seau conditions à l'ontologie mince ; voir la documentation ci-dessous pour
une explication. Le nouveau fichier d'ontologie mince, y compris les termes du compartiment, sera écrit dans
seau svelte filet

-carte de sortie svelte cartographie filet
Cela générera un fichier de mappage pour chaque terme de l'ontologie complète montrant à la fois le
terme mince le plus pertinent et tous les termes minces qui sont des ancêtres. Si vous utilisez ceci
option, ne fournissez PAS de fichier d'associations de gènes

noms d'exposition
(Ne fonctionne qu'avec -outmap)

Afficher les noms du terme dans le fichier de mappage mince

-c Cela forcera map2slim à donner le décompte du fichier assoc, plutôt que de le mapper

-t Lorsqu'il est utilisé en conjonction avec -c tabulera la sortie de sorte que l'indentation reflète
l'arborescence dans le fichier slim

-o ande filet
Cela écrira les assocs mappés (ou comptes) dans le fichier spécifié, plutôt que de
l'écran

TÉLÉCHARGER


Ce script fait partie du allez-perl package, disponible auprès du CPAN

<http://search.cpan.org/~cmungall/go-perl/>

Ce script ne fonctionnera pas sans l'installation de go-perl

CARTOGRAPHIE ALGORITHME
GO est un DAG, pas un arbre. Cela signifie qu'il y a souvent plus d'un chemin à partir d'un terme GO
jusqu'au nœud racine Gene_Ontology ; le chemin peut croiser plusieurs termes dans le slim
ontologie - ce qui signifie qu'une annotation peut correspondre à plusieurs termes fins !

(noter vous devez le visualiser en ligne pour voir l'image ci-dessous - si vous ne le visualisez pas sur
le http://www.geneontology.org site, vous pouvez consulter l'URL suivante :
<http://geneontology.cvs.sourceforge.net/*checkout*/geneontology/go-dev/go-perl/doc/map2slim.gif>
)

Un exemple hypothétique les cercles bleus montrent les termes dans le GO slim, et les cercles jaunes montrent
termes dans l'ontologie complète. L'ontologie complète subsume le slim, donc les termes bleus sont
aussi dans l'ontologie.

GO ID CARTES À SLIM ID TOUS LES ANCÊTRES SLIM
===== =============== ==================
5 2+3 2,3,1
6 3 seulement 3,1
7 4 seulement 4,3,1
8 3 seulement 3,1
9 4 seulement 4,3,1
10 2+3 2,3,1

La 2e colonne montre le ou les identifiants les plus pertinents dans le mince mappage direct. Le 3ème
La colonne montre tous les ancêtres du slim.

Notez en particulier le mappage de l'ID 9 bien que celui-ci ait deux chemins vers la racine via
le slim via 3 et 4, 3 est jeté car il est englobé par 4.

D'un autre côté, 10 mappes à la fois sur 2 et 3 car ce sont à la fois le premier ID mince dans le
deux chemins valides vers la racine, et aucun ne subsume l'autre.

L'algorithme utilisé est :

pour mapper n'importe quel terme dans l'ontologie complète : recherchez tous les chemins valides jusqu'au nœud racine dans
l'ontologie complète

pour chaque chemin, prendre le premier terme mince rencontré dans le chemin

rejetez tous les termes minces redondants dans cet ensemble, c'est-à-dire les termes minces subsumés par d'autres termes minces
dans l'ensemble

SEAU CONDITIONS
Si vous exécutez le script avec l'option -b, les termes du compartiment seront ajoutés. Pour tout terme P dans
le slim, si P a au moins un enfant C, un terme de seau P' sera créé sous P. C'est
un terme fourre-tout pour mapper n'importe quel terme dans l'ontologie complète qui est un descendant de P, mais
PAS un descendant d'un enfant de P dans l'ontologie slim.

Par exemple, le générique mince.0208 a les termes et la structure suivants :

% de liaison à l'ADN ; ALLER : 0003677
% de liaison à la chromatine ; ALLER : 0003682
% activité du facteur de transcription ; ALLER : 0003700, ALLER : 0000130

Après avoir ajouté les termes du bucket, cela ressemblera à ceci :

% de liaison à l'ADN ; ALLER : 0003677
% de liaison à la chromatine ; ALLER : 0003682
% activité du facteur de transcription ; GO:0003700 ; synonyme:GO:0000130
@bucket:liaison Z-OTHER-ADN ; slim_temp_id:12

Termes de l'ontologie complète qui sont d'autres enfants de la liaison à l'ADN, tels que single-
la liaison à l'ADN brin et ses descendants seront mappés au terme de seau.

Le terme de seau a un ID mince qui est transitoire et n'est là que pour faciliter le
cartographie. Il ne doit pas être utilisé à l'extérieur.

Le terme de compartiment a le préfixe Z-OTHER ; le Z est un hack pour s'assurer que le terme est
toujours classé en dernier dans l'ordre alphabétique.

L'algorithme est légèrement modifié si des termes de compartiment sont utilisés. Le terme de seau a un
relation implicite avec tous les autres frères et sœurs qui ne font pas partie du slim.

Do I need seau termes?

De nos jours, la plupart des fichiers minces sont entièrement ou presque « complets », c'est-à-dire qu'il n'y a pas de lacunes.
Cela signifie que l'option -b ne produira pas de résultats différents notables. Par exemple,
vous pouvez voir un terme de seau OTHER-binding créé, sans rien annoté : parce que tous
les enfants de liaison dans le GO sont représentés dans le fichier slim.

L'option de compartiment n'est vraiment nécessaire que pour certains des anciens fichiers slim archivés,
qui sont statiques et ont été générés de manière assez ad-hoc ; ils ont tendance à accumuler des « lacunes »
au fil du temps (par exemple, GO ajoutera un nouvel enfant de liaison, mais le fichier slim statique ne sera pas à la hauteur
date, de sorte que tous les produits géniques annotés avec ce nouveau terme seront mappés à la liaison OTHER dans le
maigrir)

GRAPHIQUE INCORRECTIONS
Notez que le(s) fichier(s) d'ontologie slim peuvent être obsolètes par rapport à la version actuelle
ontologie.

Actuellement, map2slim ne signale pas les incohérences de graphique entre le graphique mince et le graphique dans
le fichier d'ontologie complet ; il prend l'ontologie complète comme étant le graphe réel. Cependant, le
l'ontologie slim sera utilisée pour formater les résultats si vous sélectionnez -t -c comme option.

SORTIE
En mode normal, un fichier d'association de gènes au format standard sera écrit. La colonne GO ID
(5) contiendra les ID GO slim. Le mappage correspond à la 2ème colonne du tableau
dessus. Notez que le fichier de sortie peut contenir plus de lignes que le fichier d'entrée. C'est
car certains GO ID complets ont plusieurs ID slim pertinents.

COUNT MODE

map2slim peut être exécuté avec l'option -c, qui donnera le nombre de gènes distincts
produits mappés à chaque terme mince. Les colonnes sont les suivantes

GO Terme
La première colonne est l'ID GO suivi du nom du terme (le nom du terme est fourni comme
il se trouve à la fois dans les ontologies complètes GO et slim - ce seront généralement les mêmes
mais parfois, le fichier mince sera en retard sur les modifications du fichier GO)

Nombre de produits géniques pour lesquels c'est le terme mince le plus pertinent
le nombre de produits géniques distincts pour lesquels c'est le plus pertinent/minimum direct
IDENTIFIANT. Par le plus direct nous entendons que soit l'association se fait directement à ce terme,
OU l'association est faite à un enfant de ce terme slim ET il n'y a pas d'enfant slim
terme auquel l'association correspond.

Pour la plupart des slims, ce décompte sera équivalent au nombre d'associations directement
mappé à ce terme mince. Cependant, certains fichiers slim plus anciens sont « inégaux » en ce sens qu'ils
admettre des "lacunes". Par exemple, si le slim a tous des enfants de "processus biologique" avec
l'exception de "behavior", alors toutes les annotations à "behavior" ou à ses enfants seront
compté ici

voir exemple ci-dessous

Nombre de produits génétiques supposés être associés à un terme mince
et le nombre de produits génétiques distincts qui sont annotés à tout descendant de ce
ID slim (ou annoté directement sur l'ID slim).

indicateur d'obsolescence
GO ontologie

Pour prendre un exemple ; si nous utilisons -t et -c comme ceci :

map2slim -t -c GO_slims/goslim_generic.obo ontologie/gene_ontology.obo gene-associations/gene_association.fb

Ensuite, une partie des résultats peut ressembler à ceci :

GO:0008150 processus_biologique (process_biologique) 34 10025 processus_biologique
GO:0007610 comportement (comportement) 632 632 biologique_processus
GO:0000004 processus biologique inconnu (processus biologique inconnu) 832 832 biologique_processus
GO:0007154 communication cellulaire (communication cellulaire) 333 1701 processus_biologique
GO:0008037 reconnaissance cellulaire (reconnaissance cellulaire) 19 19 biologique_processus
19 produits ont été mappés à GO:0008037 ou à l'un de ses enfants. (GO:0008037 est un nœud feuille dans le slim, donc les deux comptes sont identiques).

En revanche, GO:0008150 n'obtient que 34 produits pour lesquels c'est le plus pertinent
terme. C'est parce que la plupart des annotations seraient mappées à un enfant de GO:0008150 dans le slim,
tels que GO:0007610 (comportement). Ces 34 produits géniques sont soit annotés directement en
GO:0008150, ou à quelque enfant de ce terme qui n'est pas dans le slim. Cela peut indiquer
« lacunes » dans le slim. Notez que l'exécution de map2slim avec l'option -b "bouchera" ces lacunes
avec des termes de remplissage artificiels.

Utilisez map2slimp en ligne en utilisant les services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

Commandes Linux

Ad