EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

fa2htgs - Online in der Cloud

Führen Sie fa2htgs im kostenlosen OnWorks-Hosting-Provider über Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator aus

Dies ist der Befehl fa2htgs, der im kostenlosen OnWorks-Hosting-Provider über eine unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


fa2htgs - Formatierer für die Einreichung von Projekten zur Genomsequenzierung mit hohem Durchsatz

ZUSAMMENFASSUNG


fa2htgs [-] [-6 str] [-7 str] [-A Dateinamen] [-C str] [-D] [-L Dateinamen] [-M str] [-N]
[-O Dateinamen] [-P str] [-Q Dateinamen] [-S str] [-T Dateinamen] [-X] [-a str] [-b N] [-c str]
[-d str] [-e Dateinamen] [-f] -g str [-h str] [-i Dateinamen] [-k str] [-l N] [-m] [-n str]
[-o Dateinamen] [-p N] [-q] [-r str] -s str [-t Dateinamen] [-u] [-v] [-w] [-x str]

BESCHREIBUNG


fa2htgs ist ein Programm zum Generieren von Seq-Submits (eine ASN.1-Sequenzeinreichungsdatei) für
Hochdurchsatz-Genomsequenzierungsprojekte.

fa2htgs liest eine FASTA-Datei (oder eine Ace Contig-Datei mit Phrap-Sequenzqualitätswerten),
eine Vorlagedatei für die Einreichung von Pailletten (um Kontakt- und Zitationsinformationen für die
Übermittlung) und eine Reihe von Befehlszeilenargumenten (siehe unten). Dieses Programm wird dann
kombiniert diese Informationen, um eine für GenBank geeignete Einreichung zu erstellen. Sobald du hast
Ihre Einreichungsdatei erstellt hat, müssen Sie das Einreichungsprotokoll befolgen (siehe README
auf Ihrem FTP-Konto vorhanden oder per Post an Ihr Center gesendet).

fa2htgs ist für die Automatisierung durch Skripte für die Massenübermittlung von nicht kommentierten
Genomsequenz. Es kann leicht von seiner aktuellen einfachen Form erweitert werden, um mehr zu ermöglichen
komplizierte Verarbeitung. Eine Einreichung erstellt mit fa2htgs kann auch eingelesen werden
Psequin(1) und dann ausführlicher kommentiert.

Fragen und Bedenken zu diesem Verarbeitungsprotokoll oder zur Verwendung dieses Tools sollten sein
weitergeleitet zu[E-Mail geschützt] >.

OPTIONAL


Nachfolgend finden Sie eine Zusammenfassung der Optionen.

- Nutzungsnachricht drucken

-6 str SP6-Klon (z. B. Contig1, links)

-7 str T7-Klon (z. B. Contig2, rechts)

-A Dateinamen
Dateiname für die Eingabe der Beitrittsliste (schließt sich gegenseitig aus mit -T und -i). Die Eingabe
Datei enthält eine tabulatorgetrennte Tabelle mit drei bis fünf Spalten, die als Accession bezeichnet werden
Nummer, Startposition, Stoppposition und (optional) Länge und Strang. Wenn
start > stop, wird der Minus-Strang des referenzierten Zugangs verwendet. Eine Lücke ist
gekennzeichnet durch das Wort "Lücke" anstelle einer Akzession, 0 für Start und Stop
Positionen und eine Zahl für die Länge.

-C str Bibliotheksname klonen (erscheint als /clone-lib="str" auf der Quellfunktion)

-D HTGS_DRAFT-Sequenz

-L Dateinamen
Lesen Sie die Phrap-Contig-Bestellung von Dateinamen. Dies ist eine tabulatorgetrennte Datei, die
verwendet, um die Reihenfolge der Contigs zu steuern (normalerweise angegeben durch -P), ebenso gut wie
zeigt die SP6- und T7-Enden an. Es kann auch verwendet werden, wenn bekannt ist, dass Contigs
in entgegengesetzter Ausrichtung. Zum Beispiel:

Contig2 + 1 SP6 übrig
Contig3 + 1
Contig1 - T7 rechts

Die erste Spalte ist der Contig-Name, die zweite die Ausrichtung, die dritte ist
die fragment_group, die vierte zeigt das SP6- oder T7-Ende an und die fünfte sagt
auf welcher Seite des SP6- oder T7-Endes der Vektor entfernt wurde.

-M str Kartenname (wird angezeigt als /map="str" auf der Quellfunktion)

-N Assembly_fragments mit Anmerkungen versehen

-O Dateinamen
Kommentar lesen von Dateinamen (maximal 100 Zeichen pro Zeile; ~ ist ein Zeilenumbruch und `~
ist ein wörtliches ~. Sie können das Format mit überprüfen PSequin(1).)

-P str Zu verwendende Contigs, durch Kommas getrennt. Wenn -P wird nicht mit angezeigt -T Option,
dann werden die Fragmente in der Reihenfolge eingefügt, in der sie sich in der ace-Datei befinden (das heißt
geeignet für einen Phase-1-Datensatz, aber nicht für eine Phase 2 oder 3). Wenn Sie einstellen müssen
die Reihenfolge der Segmente der ace-Datei, müssen Sie sie mit dem -P Flagge,
so was: -P "Contig1,Contig4,Contig3,Contig2,Contig5"

-Q Dateinamen
Lesen Sie Qualitätsbewertungen von Dateinamen

-S str Stammname

-T Dateinamen
Dateiname für die Phrap-Eingabe (schließt sich gegenseitig aus mit -A und -i)

-X Die Koordinaten in der Eingabedatei befinden sich in der resultierenden segmentierten Sequenz. (Basen
1 durch n jedes Beitritts verwendet.) Ansonsten sind die Koordinaten auf der
einzelne Zugänge, die nicht mit Basis 1 des Datensatzes beginnen müssen.

-a str GenBank-Beitritt; nur verwenden, wenn eine Sequenz aktualisiert wird.

-b N Lückenlänge (Standard = 100; alles von 0 bis 1000000000 ist zulässig)

-c str Klonname (erscheint als / Klon im Quellmerkmal; kann das gleiche sein wie -s)

-d str Titel für Sequenz (erscheint in GenBank DEFINITION Linie)

-e Dateinamen
Fehler protokollieren an Dateinamen

-f htgs_fulltop-Schlüsselwort

-g str Genome Center-Tag (wahrscheinlich identisch mit Ihrem Anmeldenamen auf dem NCBI-FTP-Server)

-h str Chromosom (erscheint als /Chromosom in der Quellfunktion)

-i Dateinamen
Dateiname für fasta-Eingabe (Standard ist stdin; sich gegenseitig ausschließend mit -A und -T)

-k str Fügen Sie die angegebene Zeichenfolge als Schlüsselwort hinzu.

-l N Länge der Sequenz in bp (Standard = 0). Die Länge wird gegen die tatsächliche geprüft
Anzahl der Basen, die wir erhalten. Für die Sequenzen der Phasen 1 und 2 wird es auch verwendet, um die Lücke zu schätzen
Längen. Bei Aufzeichnungen der Phasen 1 und 2 ist es wichtig, eine Zahl zu verwenden, die GRÖßER ist als
die Menge des bereitgestellten Nukleotids, andernfalls erzeugt dies falsche "Lücken". Hier
Es wird davon ausgegangen, dass die mutmaßliche volle Länge des BAC oder Cosmids verwendet wird. Dort
sollte zwischen den Segmenten mindestens 20 bis 30 `n' sein (diese können Sie in
Sequin), da dies ein ordnungsgemäßes Verhalten gewährleistet, wenn diese Sequenz mit BLAST verwendet wird.
Andernfalls können „artefaktische“ nicht verwandte Segmentnachbarn in die Nähe gebracht werden
von einander.

-m Kommentar aus Vorlage übernehmen

-n str Organismusname (Standard = Homo sapiens)

-o Dateinamen
Dateiname für asn.1-Ausgabe (Standard = stdout)

-p N HTGS-Phase:
1 Eine Sammlung ungeordneter Contigs mit Lücken unbekannter Länge. A Phase 1
Datensatz muss mindestens zwei Segmente mit einer Lücke haben. (Ursprünglich)
2 Eine Reihe geordneter Contigs, möglicherweise mit bekannter Lückenlänge. Das könnte sein
eine einzelne Sequenz ohne Lücken, wenn die Sequenz Mehrdeutigkeiten zu lösen hat.
3 Eine einzelne zusammenhängende Sequenz. Diese Sequenz ist beendet, aber nicht
unbedingt kommentiert.

-q htgs_cancelled Schlüsselwort

-r str Anmerkung zum Update (kurzer Kommentar, der die Art des Updates beschreibt, z
Sequenz", "neues Zitat" oder "aktualisierte Funktionen")

-s str Sequenzname. Die Sequenz muss einen innerhalb des Genoms eindeutigen Namen haben
Center. Wir verwenden die Kombination des Genomzentrumsnamens (-g Argument) und die
Sequenzname (-s), um diese Sequenz zu verfolgen und mit Ihnen darüber zu sprechen. Der Name
kann jede beliebige Form haben, muss aber innerhalb Ihres Zentrums eindeutig sein.

-t Dateinamen
Dateiname für Seq-Submit-Vorlage (Standard = template.sub)

-u Bioquelle aus Vorlage nehmen

-v htgs_activefin-Schlüsselwort

-w Whole Genome Shotgun Flagge

-x str Sekundäre Zugangsnummern, durch Kommas getrennt, st U10000,L11000.

In einigen Fällen wird ein großes Segment einen anderen oder eine Gruppe anderer Beitritte ersetzen
Zahlen (Aufzeichnungen). Diese Datensätze, die in GenBank nicht mehr benötigt werden, sollten
sekundär gemacht. Verwendung der -x Argument können Sie die gewünschten Zugangsnummern auflisten
sekundär zu machen. Dadurch werden wir angewiesen, die Zugangsnummer(n) von . zu entfernen
GenBank und wird nicht mehr Teil der GenBank-Version sein. Sie werden es trotzdem
bei Entrez erhältlich sein.

GREAT PFLEGE sollte bei der Verwendung dieses Arguments verwendet werden!!! Unsachgemäße Verwendung des Beitritts
Zahlen hier führen zur unangemessenen Entnahme von GenBank-Datensätzen aus
GenBank, EMBL und DDBJ. Wir stellen diesen Parameter zur Vereinfachung der Übermittlung zur Verfügung
Zentren, aber diese müssen möglicherweise entfernt werden, wenn sie nicht sorgfältig verwendet werden.

Verwenden Sie fa2htgs online mit den onworks.net-Diensten


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad