EnglischFranzösischSpanisch

Server ausführen | Ubuntu > | Fedora > |


OnWorks-Favicon

map2slimp - Online in der Cloud

Führen Sie map2slimp im kostenlosen OnWorks-Hosting-Provider über Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator aus

Dies ist der Befehl map2slimp, der im kostenlosen OnWorks-Hosting-Provider über eine unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME


map2slim - ordnet Genassoziationen einer 'schlanken' Ontologie zu

ZUSAMMENFASSUNG


cd geh
map2slim GO_slims/goslim_generic.obo ontology/gene_ontology.obo gene-associations/gene_association.fb

BESCHREIBUNG


Bei einer GO Slim-Datei und einer aktuellen Ontologie (in einer oder mehreren Dateien) wird dieses Skript zugeordnet
eine Genassoziationsdatei (mit Anmerkungen zum vollständigen GO) zu den Begriffen im GO
schlank.

Das Skript kann verwendet werden, um entweder eine neue Genassoziationsdatei zu erstellen, die die meisten
relevante GO Slim-Akzessionen oder im Zählmodus, in diesem Fall wird es ein eindeutiges Gen geben
Produkt zählt für jeden schmalen Begriff

Das Assoziationsdateiformat wird hier beschrieben:

<http://www.geneontology.org/GO.annotation.shtml#datei>

ARGUMENTE


-b Eimer schlank Datei
Dieses Argument fügt hinzu Eimer AGB zur schlanken Ontologie; siehe die Dokumentation unten für
eine Erklärung. Die neue schlanke Ontologiedatei, einschließlich der Bucket-Begriffe, wird in geschrieben
Eimer schlank Datei

-outmap schlank Mapping Datei
Dadurch wird für jeden Begriff in der vollständigen Ontologie eine Zuordnungsdatei generiert, die sowohl die
der relevanteste schlanke Begriff und alle schlanken Begriffe, die Vorfahren sind. Wenn du das verwendest
Option, geben Sie KEINE Gen-Assoziations-Datei an

Shownamen
(Funktioniert nur mit -outmap)

Zeigen Sie die Namen des Begriffs in der schlanken Mapping-Datei an

-c Dies zwingt map2slim, die Anzahl der assoc-Datei anzugeben, anstatt sie zuzuordnen

-t Bei Verwendung in Verbindung mit -c wird die Ausgabe mit einem Tabulator versehen, so dass die Einrückung widerspiegelt
die Baumhierarchie in der schlanken Datei

-o draußen Datei
Dadurch werden die zugeordneten Assocs (oder Counts) in die angegebene Datei geschrieben, anstatt in
der Bildschirm

HERUNTERLADEN


Dieses Skript ist Teil der go-perl Paket, erhältlich bei CPAN

<http://search.cpan.org/~cmungall/go-perl/>

Dieses Skript funktioniert nicht, ohne go-perl zu installieren

KORR ALGORITHM
GO ist ein DAG, kein Baum. Das bedeutet, dass es oft mehr als einen Pfad von einem GO-Term gibt
bis zum Stammknoten Gene_Ontology; der Pfad kann mehrere Begriffe in der Slim schneiden
Ontologie - was bedeutet, dass eine Annotation mehreren schlanken Begriffen zugeordnet werden kann!

(beachten Sie müssen dies online anzeigen, um das Bild unten zu sehen - wenn Sie es nicht auf sehen
den http://www.geneontology.org Website können Sie die folgende URL aufrufen:
<http://geneontology.cvs.sourceforge.net/*zur Kasse*/geneontology/go-dev/go-perl/doc/map2slim.gif>
)

Ein hypothetisches Beispiel blaue Kreise zeigen Begriffe im GO slim und gelbe Kreise zeigen
Begriffe in der vollständigen Ontologie. Die vollständige Ontologie umfasst das Schlanke, also sind die blauen Begriffe
auch in der Ontologie.

GO ID MAPS TO SLIM ID ALLE SLIM Ahnen
===== =============== ==================
5 2 + 3 2,3,1
6 3 nur 3,1
7 4 nur 4,3,1
8 3 nur 3,1
9 4 nur 4,3,1
10 2 + 3 2,3,1

Die 2. Spalte zeigt die relevantesten ID(s) im schlanken Direkt-Mapping. Der 3.
Spalte zeigt alle Vorfahren im schlanken.

Beachten Sie insbesondere die Zuordnung von ID 9, obwohl diese zwei Pfade zur Wurzel hat durch
die Slim über 3 und 4, 3 wird verworfen, weil sie von 4 subsumiert wird.

Auf der anderen Seite wird 10 sowohl auf 2 als auch auf 3 abgebildet, da dies beide die erste schlanke ID im
zwei gültige Pfade zur Wurzel, und keiner subsumiert den anderen.

Der verwendete Algorithmus ist:

um einen beliebigen Begriff in der vollständigen Ontologie abzubilden: Finden Sie alle gültigen Pfade bis zum Wurzelknoten in
die vollständige Ontologie

Nehmen Sie für jeden Pfad den ersten schmalen Begriff, der auf dem Pfad auftritt

verwerfen Sie alle überflüssigen schlanken Begriffe in diesem Satz, dh schlanke Begriffe werden von anderen schlanken Begriffen subsumiert
im Set

EIMER BEDINGUNGEN
Wenn Sie das Skript mit der Option -b ausführen, werden Bucket-Begriffe hinzugefügt. Für jeden Term P in
die schlanke, wenn P mindestens ein Kind C hat, wird ein Bucket-Term P' unter P erstellt. Dies ist
ein Sammelbegriff zum Abbilden eines beliebigen Begriffs in der vollständigen Ontologie, der ein Nachkomme von P ist, aber
KEIN Nachkomme eines Kindes von P in der schlanken Ontologie.

Das schlanke generische.0208 hat beispielsweise die folgenden Begriffe und Struktur:

%DNA Bindung ; GEHEN:0003677
% Chromatinbindung ; GEHEN:0003682
% Transkriptionsfaktor-Aktivität ; GO:0003700, GO:0000130

Nach dem Hinzufügen von Bucket-Begriffen sieht es so aus:

%DNA Bindung ; GEHEN:0003677
% Chromatinbindung ; GEHEN:0003682
% Transkriptionsfaktor-Aktivität ; GO:0003700 ; synonym:GO:0000130
@bucket:Z-OTHER-DNA-Bindung ; slim_temp_id:12

Begriffe aus der vollständigen Ontologie, die andere Kinder der DNA-Bindung sind, wie z.
gestrandete DNA-Bindung und ihre Nachkommen werden dem Bucket-Term zugeordnet.

Der Bucket-Begriff hat eine schlanke ID, die vorübergehend ist und nur dazu da ist, die
Kartierung. Es sollte nicht äußerlich verwendet werden.

Der Bucket-Term hat das Präfix Z-OTHER; das Z ist ein Hack, um sicherzustellen, dass der Begriff richtig ist
in alphabetischer Reihenfolge immer als letztes aufgeführt.

Der Algorithmus wird leicht modifiziert, wenn Bucket-Terme verwendet werden. Der Bucket-Term hat ein
implizite Beziehung zu allen ANDEREN Geschwistern nicht im Schlanken.

Do I brauchen Eimer Begriffe?

Heutzutage sind die meisten schlanken Dateien ganz oder fast „vollständig“, d. h. es gibt keine Lücken.
Dies bedeutet, dass die Option -b keine merklichen unterschiedlichen Ergebnisse erzeugt. Zum Beispiel,
Möglicherweise sehen Sie einen Bucket-Begriff OTHER-Bindung erstellt, ohne dass dazu eine Anmerkung hinzugefügt wurde: weil alle
die Kinder der Bindung im GO werden in der schlanken Datei dargestellt.

Die Bucket-Option ist wirklich nur für einige der älteren archivierten Slim-Dateien erforderlich,
die statisch sind und ziemlich ad-hoc generiert wurden; sie neigen dazu, "Lücken" zu sammeln
im Laufe der Zeit (z. B. fügt GO ein neues untergeordnetes Element der Bindung hinzu, aber die statische schlanke Datei wird nicht
Datum, sodass alle Genprodukte, die zu diesem neuen Begriff annotiert sind, der OTHER-Bindung im . zugeordnet werden
schlank)

GRAPH ÜBEREINSTIMMUNGEN
Beachten Sie, dass die schlanke(n) Ontologiedatei(en) in Bezug auf die aktuelle(n) möglicherweise veraltet sind
Ontologie.

Derzeit markiert map2slim keine Diagrammkonflikte zwischen dem schlanken Diagramm und dem Diagramm in
die vollständige Ontologiedatei; es nimmt die vollständige Ontologie als den realen Graphen an. Allerdings ist die
Slim Ontology wird verwendet, um die Ergebnisse zu formatieren, wenn Sie auswählen -t -c als Optionen.

AUSGABE
Im normalen Modus wird eine Gen-Assoziationsdatei im Standardformat geschrieben. Die Spalte GO ID
(5) enthält GO slim IDs. Die Zuordnung entspricht der 2. Spalte in der Tabelle
Oben. Beachten Sie, dass die Ausgabedatei möglicherweise mehr Zeilen enthält als die Eingabedatei. Das ist
weil einige vollständige GO-IDs mehr als eine zugehörige Slim-ID haben.

COUNT MODE

map2slim kann mit der Option -c ausgeführt werden, die die Anzahl der einzelnen Gene angibt
Produkte, die jedem schlanken Begriff zugeordnet sind. Die Spalten sind wie folgt

GO-Term
Die erste Spalte ist die GO-ID, gefolgt vom Begriffsnamen (der Begriffsname wird bereitgestellt als
es ist sowohl in der vollständigen GO- als auch in der schlanken Ontologie zu finden - diese sind normalerweise gleich
aber gelegentlich bleibt die schlanke Datei hinter Änderungen in der GO-Datei zurück)

Anzahl der Genprodukte, für die dies der relevanteste schlanke Begriff ist
die Anzahl der unterschiedlichen Genprodukte, für die dies die relevanteste/direkte Schlankheit ist
ICH WÜRDE. Mit am direktesten meinen wir, dass entweder die Assoziation direkt zu diesem Begriff erfolgt,
ODER die Assoziation wird zu einem Kind dieses schlanken Begriffs gemacht UND es gibt kein Kind schlank
Begriff, dem die Assoziation zugeordnet ist.

Für die meisten Slims entspricht diese Anzahl direkt der Anzahl der Assoziationen
diesem schlanken Begriff zugeordnet. Einige ältere schlanke Dateien sind jedoch "fleckig", da sie
"Lücken" zugeben. Zum Beispiel, wenn der Schlanke alle Kinder des "biologischen Prozesses" mit hat
mit Ausnahme von "Verhalten" werden dann alle Anmerkungen zu "Verhalten" oder seinen Kindern
hier gezählt

siehe Beispiel unten

Anzahl der Genprodukte, von denen angenommen wird, dass sie mit Slim Term in Verbindung stehen
und die Anzahl der verschiedenen Genprodukte, die jedem Nachkommen von diesem annotiert sind
Slim-ID (oder direkt zur Slim-ID kommentiert).

Veraltungsflagge
GO-Ontologie

Um ein Beispiel zu nehmen; wenn wir -t und -c so verwenden:

map2slim -t -c GO_slims/goslim_generic.obo ontology/gene_ontology.obo gene-associations/gene_association.fb

Ein Teil der Ergebnisse kann dann so aussehen:

GO:0008150 biologischer_prozess (biologischer_prozess) 34 10025 biologischer_prozess
GO:0007610 Verhalten (Verhalten) 632 632 biologischer_Prozess
GO:0000004 biologischer Prozess unbekannt (biologischer Prozess unbekannt) 832 832 biologischer_prozess
GO:0007154 Zellkommunikation (Zellkommunikation) 333 1701 biologischer_prozess
GO:0008037 Zellerkennung (Zellerkennung) 19 19 biologischer_prozess
19 Produkte wurden GO:0008037 oder einem seiner untergeordneten Elemente zugeordnet. (GO:0008037 ist ein Blattknoten im Slim, daher sind die beiden Zählungen identisch).

Auf der anderen Seite bekommt GO:0008150 nur 34 Produkte, für die dies am relevantesten ist
Begriff. Dies liegt daran, dass die meisten Anmerkungen einem Kind von GO:0008150 in der schlanken,
wie GO:0007610 (Verhalten). Diese 34 Genprodukte sind entweder direkt annotiert an
GO:0008150, oder an ein Kind dieses Begriffs, der nicht im Schlanken steht. Dies kann darauf hindeuten
'Lücken' im Schlanken. Beachten Sie, dass das Ausführen von map2slim mit der Option -b diese Lücken "schließt".
mit künstlichen Füllbegriffen.

Verwenden Sie map2slimp online mit den Diensten von onworks.net


Ad


Ad