Dies ist der Befehl bp_unflatten_seqp, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
bp_unflatten_seq – glättet eine Genbank- oder Genbank-artige Feature-Datei in eine verschachtelte Datei
SeqFeature-Hierarchie
ZUSAMMENFASSUNG
bp_unflatten_seq.PLS -e 3 -gff ~/cvs/bioperl-live/t/data/AE003644_Adh-genomic.gb
bp_unflatten_seq.PLS --detail ~/cvs/bioperl-live/t/data/AE003644_Adh-genomic.gb
bp_unflatten_seq.PLS -i foo.embl --from embl --to chadoxml -o out.chado.xml
bp_unflatten_seq.PLS --notypemap --detail --to asciitree -ethresh 2 AE003644_Adh-genomic.gb
BESCHREIBUNG
Dieses Skript wird abflachen eine Genbank- oder Genbank-ähnliche Datei mit SeqFeatures in eine verschachtelte Datei
Hierarchie.
Siehe Bio::SeqFeature::Tools::Unflattener
In einer GenBank/EMBL-Darstellung sind die Merkmale „flach“ – es gibt beispielsweise keine Verbindung
zwischen einer mRNA und einem CDS, außer impliziten Verbindungen (z. B. über Tags oder über die Spleißstelle).
Koordinaten), die möglicherweise schwer zu codieren sind.
Dies lässt sich am einfachsten mit dem Standardausgabeformat veranschaulichen: asciitree
Ein nicht abgeflachter Genbank-Funktionssatz könnte so aussehen (AB077698)
Seq: AB077698
Datenbank_Eintrag 1..2701[+]
Gen
mRNA
CDS hCHCR-G 80..1144[+]
Exon 80..1144[+]
five_prime_UTR 1..79[+]
location_sequence_feature 137..196[+]
location_sequence_feature 239..292[+]
location_sequence_feature 617..676[+]
location_sequence_feature 725..778[+]
three_prime_UTR 1145..2659[+]
polyA_site 1606..1606[+]
polyA_site 2660..2660[+]
Oder so (Teil von AE003734)
Gen
mRNA CG3320-RA
CDS CG3320-PA 53126..54971[-]
Exon 52204..53323[-]
Exon 53404..53631[-]
Exon 53688..53735[-]
Exon 53798..53918[-]
Exon 54949..55287[-]
mRNA CG3320-RB
CDS CG3320-PB 53383..54971[-]
Exon 52204..53631[-]
Exon 53688..53735[-]
Exon 53798..53918[-]
Exon 54949..55287[-]
Die Entflachung wird auch die Eindämmungshierarchie „normalisieren“ (im Sinne von
Standardisierung – z. B. Sicherstellung, dass immer eine Transkriptaufzeichnung vorhanden ist, auch wenn es sich um eine Genbank handelt
spezifiziert nur CDS und Gen)
Standardmäßig werden die GenBank-Typen SO-Typen zugeordnet
Siehe Bio::SeqFeature::Tools::TypeMapper
COMMAND LINE ARGUMENTE
-i|Eingabedatei
Eingabedatei (kann auch als letztes Argument angegeben werden)
-von FORMAT
Eingabeformat (standardmäßig Genbank)
Es macht wahrscheinlich nicht so viel Sinn, dies für nicht flache Formate zu verwenden. also anders als
Embl/Genbank
-formatieren
Ausgabeformat (standardmäßig ASCIItree)
sollte wirklich ein Format sein, das verschachtelte SeqFeature-Funktionen berücksichtigt; Ich denke, das ist nur so
asciitree, chadoxml und gff3
-gff
mit Export in das GFF3-Format (Vor-3-GFFs machen bei nicht reduzierten Sequenzen keinen Sinn, da
Sie haben keine festgelegte Möglichkeit, Merkmalsgraphen darzustellen.)
-o|Ausgabedatei
outfile ist standardmäßig STDOUT
-Detail
Zusätzliche Details zu Funktionen anzeigen (nur ASCII-Tree-Modus)
-e|ethresh INT
legt den Fehlerschwellenwert beim Aufheben der Glättung fest
Standardmäßig gibt dieses Skript einen Wackelcode aus, wenn es in der Genbank auf seltsame Dinge stößt
Datei – Erhöhen Sie den Fehlerschwellenwert, um zu signalisieren, dass diese ignoriert (und gemeldet) werden
STDERR)
-nomagisch
Unterdrücke use_magic beim Unflattening (siehe Bio::SeqFeature::Tools::Unflattener
-notypemap
Typzuordnung unterdrücken (siehe Bio::SeqFeature::Tools::TypeMapper
ALLES
Bio::SeqFeature::Tools::Unflattener ermöglicht eine feinkörnige Kontrolle über das Unflattening
Prozess – Es müssen weitere Optionen hinzugefügt werden, um diese Steuerung in der Befehlszeile zu ermöglichen
FEEDBACK
Postsendung Listen
Benutzerfeedback ist ein wesentlicher Bestandteil der Weiterentwicklung dieses und anderer Bioperl-Module. Senden
Ihre Kommentare und Anregungen vorzugsweise an die Bioperl-Mailingliste. Deine Teilnahme
wird sehr geschätzt.
[E-Mail geschützt] - Allgemeine Diskussion
http://bioperl.org/wiki/Mailing_lists - Über die Mailinglisten
Reporting Fehler
Melden Sie Fehler an das Bug-Tracking-System von Bioperl, damit wir die Fehler und ihre Fehler im Auge behalten können
Auflösung. Fehlerberichte können per E-Mail oder über das Internet eingereicht werden:
https://github.com/bioperl/bioperl-live/issues
Verwenden Sie bp_unflatten_seqp online über die Dienste von onworks.net