EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

gt-extractseq – Online in der Cloud

Führen Sie gt-extractseq beim kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehl gt-extractseq, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


gt-extractseq – Extrahieren Sie Sequenzen aus bestimmten Sequenzdateien oder Fastaindex.

ZUSAMMENFASSUNG


gt Extraktseq [Option ...] [Sequenzdatei(en)] | Fastaindex

BESCHREIBUNG


-vonpos [Wert]
Extrahieren Sie die Sequenz ab dieser Position und zählen Sie von 1 an (Standard: 0).

-Topos [Wert]
Extrahieren Sie die Sequenz bis zu dieser Position und zählen Sie von 1 an (Standard: 0).

-Spiel [Schnur]
Extrahieren Sie alle Sequenzen, deren Beschreibung mit dem angegebenen Muster übereinstimmt. Das vorgegebene Muster
muss ein gültiger erweiterter regulärer Ausdruck sein. (Standard: undefiniert)

-Schlüssel [Dateinamen]
Teilzeichenfolgen für Schlüssel in der angegebenen Datei extrahieren (Standard: undefiniert)

-Breite [Wert]
Ausgabebreite für FASTA-Sequenzdruck festlegen (0 deaktiviert die Formatierung) (Standard: 0)

-o [Dateinamen]
Ausgabe an angegebene Datei umleiten (Standard: undefiniert)

-gzip [ja|nein]
gzip komprimierte Ausgabedatei schreiben (Standard: nein)

-bzip2 [ja|nein]
bzip2-komprimierte Ausgabedatei schreiben (Standard: nein)

-Macht [ja|nein]
Schreiben in Ausgabedatei erzwingen (Standard: nein)

-Hilfe
Hilfe anzeigen und beenden

-Ausführung
Versionsinformationen anzeigen und beenden

Die Option -keys ermöglicht es, Teilzeichenfolgen oder Sequenzen aus der angegebenen Sequenz zu extrahieren
Datei oder aus einem Fasta-Index. Die zu extrahierenden Teilzeichenfolgen werden in einer Schlüsseldatei angegeben
als Argument für diese Option angegeben. Die Schlüsseldatei muss Zeilen des Formulars enthalten

k

or

kij

Dabei ist k eine Zeichenfolge (der Schlüssel) und die optionalen i und j sind positive ganze Zahlen, so dass
i⇐j. k ist der Schlüssel und die optionalen Zahlen i und j geben die erste Position des an
Teilzeichenfolge und die letzte Position der zu extrahierenden Teilzeichenfolge. Die Positionen sind
gezählt von 1. Wenn k mit der Zeichenfolge zwischen dem ersten ersten und dem zweiten identisch ist
Vorkommen des Symbols | in einem Fasta-Header, dann der Fasta-Header und der entsprechende
Die Reihenfolge wird ausgegeben. Zum Beispiel im Fasta-Header

>tr|A0AQI4|A0AQI4_9ARCH Mutmaßliche Ammoniakmonooxygenase (Fragment)

Der Fasta-Schlüssel ist A0AQI4. Wenn i und j beide angegeben sind, dann die entsprechende Teilzeichenfolge
wird im Fasta-Format angezeigt. Im letzteren Fall ist der Header der Fasta-formatierten Sequenz in
Die Ausgabe beginnt mit

>kij

gefolgt vom ursprünglichen Original-Fasta-Header.

Wenn es sich bei der Sequenzeingabe um Fasta-Dateien handelt, gilt Folgendes:

· Doppelte Zeilen in der Eingabedatei führen zu nur einer Sequenz in der Ausgabe

· Die Sequenzen werden entsprechend der Reihenfolge in den Original-Sequenzdateien ausgegeben

· Die Formatierung der Ausgabe kann über die Optionen gesteuert werden -Breite, -o, -gzip und
-bzip2

Wenn die Sequenzeingabe von einem Fasta-Index stammt (siehe unten), gilt Folgendes:

· Möglichkeit -Breite erforderlich ist

· Möglichkeit -o, -gzip und -bzip2 arbeite nicht

· Die Sequenzen werden in der Reihenfolge ausgegeben, in der die entsprechenden Schlüssel in der Schlüsseldatei erscheinen

Wenn das Ende der Argumentliste nur einen Dateinamen enthält, beispielsweise Fastaindex, dann ist dies der Fall
überprüft, ob es eine Datei fastaindex.kys gibt. Dies ist Teil des Fasta-Index
wird durch Aufruf des Suffixerator-Tools wie folgt erstellt:

gt-Suffixerator -protein -ssp -tis -des -sds -kys -indexname fastaindex \
-db Eingabedatei1 [Eingabedatei2 ..]

Dies liest die der Option übergebenen Proteinsequenzdateien -db und erstellt mehrere Dateien:

· eine Datei fastaindex.esq, die die Sequenz darstellt.

· eine Datei fastaindex.ssp, die die Positionen der Sequenztrennzeichen angibt.

· eine Datei fastaindex.des, die die Fasta-Header Zeile für Zeile anzeigt.

· eine Datei fastaindex.sds, die die Positionen der Sequenz-Header-Trennzeichen angibt.

· eine Datei fastaindex.kys, die die Schlüssel in den Fasta-Dateien enthält.

Damit der Suffixerator-Befehl funktioniert, müssen die Schlüssel die Form |key| haben im Fasta-Header muss
die folgenden Einschränkungen erfüllen:

· Sie müssen alle gleich lang sein, nicht länger als 128 und nicht kürzer als 1

· Sie müssen in lexikografischer Reihenfolge erscheinen

REPORTING Fehler


Fehler melden an[E-Mail geschützt] >.

Verwenden Sie gt-extractseq online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad