Dies ist der Befehl gmap, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
gmap – Programm zur Genomkartierung und -ausrichtung
ZUSAMMENFASSUNG
gmap [OPTIONAL...] <FASTA Dateien...>, or Katze | gmap [OPTIONEN...]
OPTIONAL
zufuhr Optionen (muss das -d or -g)
-D, --dir=Verzeichnis
Genomverzeichnis. Standard (wie angegeben durch --with-gmapdb zum Konfigurationsprogramm)
is /var/cache/gmap
-d, --db=STRING
Genomdatenbank. Wenn das Argument '?' (mit Anführungszeichen), dieser Befehl listet auf
verfügbaren Datenbanken.
-k, --kmer=INT
kmer-Größe zur Verwendung in der Genomdatenbank (zulässige Werte: 16 oder weniger). Wenn nicht
angegeben, findet das Programm die höchste verfügbare kmer-Größe im Genom
Datenbank
--Probenahme=INT
Probenahme zur Verwendung in der Genomdatenbank. Wenn nicht angegeben, findet das Programm die
kleinster verfügbarer Stichprobenwert in der Genomdatenbank innerhalb der ausgewählten k-mer-Größe
-G, --genomefull
Vollständiges Genom verwenden (alle ASCII-Zeichen zulässig; explizit beim Setup erstellt), nicht
komprimierte Version
-g, --gseg=Dateinamen
Vom Benutzer bereitgestelltes Genomsegment
-1, --selfalign
Richten Sie eine Sequenz im FASTA-Format über stdin gegen sich selbst aus (nützlich zum Abrufen
Proteinübersetzung einer Nukleotidsequenz)
-2, --pairalign
Richten Sie zwei Sequenzen im FASTA-Format über stdin aus, die erste ist genomisch und die zweite
Eine davon ist cDNA
--cmdline=STRING,STRING
Richten Sie diese beiden in der Befehlszeile bereitgestellten Sequenzen aus, wobei die erste genomische und die erste ist
Das zweite ist cDNA
-q, --Teil=INT/INT
Verarbeiten Sie nur die i-te von jeweils n Sequenzen, z. B. 0/100 oder 99/100 (nützlich für
Verteilung von Jobs an eine Computerfarm).
--input-buffer-size=INT
Größe des Eingabepuffers (aus Effizienzgründen liest das Programm so viele Sequenzen gleichzeitig)
(Standardeinstellung 1000)
Berechnungsmöglichkeiten
-B, --Charge=INT
Batch-Modus (Standard = 2)
Modus versetzt Positionen im Genom
0 siehe Hinweis mmap mmap
1 siehe Hinweis mmap und mmap vorladen
(Standard) 2 siehe Hinweis mmap & mmap vorladen & mmap vorladen
3 siehe Hinweis mmap zuweisen und vorladen
4 siehe Notiz zuweisen zuweisen
5 erweitern zuordnen zuordnen
Hinweis: Für eine einzelne Sequenz verwenden alle Datenstrukturen mmap
Wenn mmap nicht verfügbar und „Allocate“ nicht ausgewählt ist, wird Fileio verwendet (sehr langsam).
Notiz über --Charge und Offsets: Die Erweiterung der Offsets kann gesteuert werden
unabhängig von der --expand-offsets Flagge. Das --Charge=5 Option ist äquivalent zu
--Charge=4 erfahren --expand-offsets=1
--expand-offsets=INT
Ob der Genom-Offset-Index erweitert werden soll. Werte: 0 (Nein, Standard) oder 1 (Ja).
Die Erweiterung ermöglicht eine schnellere Ausrichtung, erfordert jedoch mehr Speicher
--nosplicing
Schaltet das Spleißen aus (nützlich zum Ausrichten von Genomsequenzen an einem Genom)
--min-intronlength=INT
Mindestlänge für ein internes Intron (Standard 9). Unterhalb dieser Größe entsteht eine genomische Lücke
wird als Löschung und nicht als Intron betrachtet.
-K, --intronlength=INT
Maximale Länge für ein internes Intron (Standard 200000)
-w, --localsplicedist=INT
Maximale Länge für bekannte Spleißstellen am Ende der Sequenz (Standard 2000000)
-L, --Gesamtlänge=INT
Maximale Gesamtlänge des Introns (Standard: 2400000)
-x, --chimera-margin=INT
Menge der nicht ausgerichteten Sequenz, die die Suche nach der verbleibenden Sequenz auslöst
(Standard 30). Ermöglicht die Ausrichtung chimärer Lesevorgänge und kann bei einigen hilfreich sein
nicht-chimäre Lesevorgänge. Zum Ausschalten auf Null stellen.
--keine Chimären
Schaltet die Suche nach Chimären aus. Gleicher Effekt wie --chimera-margin=0
-t, --nthreads=INT
Anzahl der Arbeitsthreads
-c, --chrsubset=Schnur
Beschränken Sie die Suche auf ein bestimmtes Chromosom
-z, --Richtung=STRING
cDNA-Richtung (sense_force, antisense_force, sense_filter, antisense_filter oder
automatisch (Standard))
-H, --trimendexons=INT
End-Exons mit weniger als der angegebenen Anzahl von Übereinstimmungen kürzen (in nt, Standard 9)
--canonical-mode=INT
Belohnung für kanonische und semikanonische Introns 0 = niedrige Belohnung, 1 = hohe Belohnung
(Standard), 2 = niedrige Belohnung für Sequenzen mit hoher Identität und ansonsten hohe Belohnung
--kreuzspezies
Verwenden Sie eine sensiblere Suche für kanonisches Spleißen, was besonders hilfreich ist
Artenübergreifende Ausrichtungen und andere schwierige Fälle
--allow-close-indels=INT
Ein Einfügen und Löschen nahe beieinander zulassen (0=Nein, 1=Ja (Standard), 2=Nur).
für hochwertige Ausrichtungen)
--microexon-spliceprob=FLOAT
Erlauben Sie Mikroexons nur, wenn eine der Spleißstellenwahrscheinlichkeiten größer ist
Wert (Standard 0.95)
--cmetdir=STRING
Verzeichnis für Methylcytosin-Indexdateien (erstellt mit cmetindex) (Standard ist
Speicherort der Genomindexdateien, die mit angegeben wurden -D, -V und -d)
--atoidir=STRING
Verzeichnis für A-to-I-RNA-Bearbeitungsindexdateien (erstellt mit atoiindex) (Standard ist
Speicherort der Genomindexdateien, die mit angegeben wurden -D, -V und -d)
--Modus=STRING
Ausrichtungsmodus: Standard (Standard), cmet-stranded, cmet-nonstranded, atoi-stranded,
atoi-nonstranded, ttoc-stranded oder ttoc-nonstranded. Nicht standardmäßige Modi erfordern
Sie müssen zuvor die Programme cmetindex oder atoiindex ausgeführt haben (die auch Folgendes abdecken).
die ttoc-Modi) auf dem Genom
-p, --prunelevel
Beschneidungsstufe: 0 = keine Beschneidung (Standard), 1 = schlechte Sequenzen, 2 = sich wiederholende Sequenzen, 3 = schlecht und
repetitiv
Ausgabearten
-S, --Zusammenfassung
Nur Zusammenfassung der Ausrichtungen anzeigen
-A, --ausrichten
Ausrichtungen anzeigen
-3, --kontinuierlich
Ausrichtung in drei durchgehenden Linien anzeigen
-4, --continuous-by-exon
Ausrichtung in drei Zeilen pro Exon anzeigen
-Z, --Kompresse
Druckausgabe im komprimierten Format
-E, --Exons=STRING
Exons („cdna“ oder „genomic“) drucken
-P, --protein_dna
Proteinsequenz (cDNA) drucken
-Q, --protein_gen
Proteinsequenz drucken (genomisch)
-f, --Format=INT
Anderes Format für die Ausgabe (beachten Sie auch die -A und -S Optionen und andere aufgeführte Optionen
unter Ausgabetypen):
psl (oder 1) = PSL (BLAT)-Format,
gff3_gene (oder 2) = GFF3-Genformat,
gff3_match_cdna (oder 3) = GFF3 cDNA_match-Format,
gff3_match_est (oder 4) = GFF3 EST_match-Format,
splicesites (oder 6) = splicesites-Ausgabe (für GSNAP-Spleißdatei),
introns = Introns-Ausgabe (für GSNAP-Spleißdatei),
map_exons (oder 7) = IIT FASTA Exon-Kartenformat,
map_ranges (oder 8) = IIT FASTA-Bereichskartenformat,
Koordinaten (oder 9) = Koordinaten im Tabellenformat,
Sampe = SAM-Format (Paired_read-Bit im Flag setzen),
samse = SAM-Format (ohne das Paired_read-Bit zu setzen)
Ausgabeoptionen
-n, --npaths=INT
Maximale Anzahl anzuzeigender Pfade (Standard 5). Wenn der Wert auf 1 gesetzt ist, meldet GMAP nichts
chimäre Ausrichtungen, da diese zwei Pfade implizieren. Wenn Sie eine einzelne Ausrichtung wünschen
plus chimäre Ausrichtungen, dann setzen Sie diesen Wert auf 0.
--suboptimal-score=INT
Melden Sie nur Pfade, deren Bewertung innerhalb dieses Werts des besten Pfads liegt. Standardmäßig,
wenn diese Möglichkeit nicht gegeben ist,
Das Programm gibt alle gefundenen Pfade aus.
-O, --bestellt
Ausgabe in derselben Reihenfolge wie Eingabe drucken (nur relevant, wenn mehr als ein Arbeiter vorhanden ist).
Gewinde)
-5, --md5
Drucken Sie die MD5-Prüfsumme für jede Abfragesequenz
-o, --chimera-overlap
Überlappung, um sie, falls vorhanden, am Chimären-Haltepunkt anzuzeigen
--failsonly
Drucken Sie nur fehlgeschlagene Ausrichtungen, also solche ohne Ergebnisse
--nofails
Schließen Sie das Drucken fehlgeschlagener Ausrichtungen aus
-V, --snpsdir=STRING
Verzeichnis für SNPs-Indexdateien (erstellt mit snpindex) (Standard ist der Speicherort von
Genomindexdateien, die mit angegeben wurden -D und -d)
-v, --use-snps=STRING
Verwenden Sie eine Datenbank mit bekannten SNPs (in .iit, zuvor erstellt mit
snpindex) für Toleranz gegenüber SNPs
--split-output=STRING
Basisname für die Ausgabe mehrerer Dateien, separat für Nomapping,
uniq, mult, (und chimera, if --chimera-margin ist ausgewählt)
--failed-input=STRING
Drucken Sie vollständig fehlgeschlagene Ausrichtungen als Eingabe-FASTA- oder FASTQ-Format in das angegebene Format
Datei. Wenn die --split-output Wenn auch das Flag angegeben ist, wird diese Datei zusätzlich generiert
zur Ausgabe in der .nomapping-Datei.
--append-output
Wann --split-output or --failedinput gegeben ist, hängt dieses Flag die Ausgabe an die an
vorhandene Dateien. Andernfalls werden standardmäßig neue Dateien erstellt.
--output-buffer-size=INT
Puffergröße in Abfragen für den Ausgabethread (Standard 1000). Wenn die Anzahl der
Wenn die zu druckenden Ergebnisse diese Größe überschreiten, werden die Arbeitsthreads angehalten, bis die
Rückstand wird abgebaut
-F, --in voller Länge
Nehmen Sie Protein in voller Länge an, beginnend mit Met
-a, --cdsstart=INT
Codons aus gegebenem Nukleotid übersetzen (1-basiert)
-T, --kürzen
Ausrichtung um Protein in voller Länge kürzen, Met to Stop impliziert -F Flagge.
-Y, --tolerant
Übersetzt cDNA mit Korrekturen für Frameshifts
Optionen für die GFF3-Ausgabe
--gff3-add-separators=INT
Ob nach jeder Abfragesequenz ein ###-Trennzeichen hinzugefügt werden soll. Werte: 0 (nein), 1 (ja,
Standard)
Optionen für die SAM-Ausgabe
--no-sam-headers
Kopfzeilen, die mit „@“ beginnen, werden nicht gedruckt.
--sam-use-0M
Fügen Sie 0M in CIGAR zwischen benachbarten Einfügungen und Löschungen ein. Von Picard gefordert,
kann aber Fehler in anderen Tools verursachen
--force-xs-dir
Für RNA-Seq-Alignments ist XS:A: nicht zulässig. wenn die Sinnesrichtung unklar ist, und
ersetzt diesen Wert willkürlich durch XS:A:+. Kann für einige Programme nützlich sein, z
B. Manschettenknöpfe, die nicht mit XS:A:? umgehen können. Wenn Sie jedoch dieses Flag verwenden, wird die
Der gemeldete Wert von XS:A:+ ist in diesen Fällen nicht aussagekräftig.
--md-lowercase-snp
In MD-String, wenn bekannte SNPs durch gegeben sind -v Flagge,
druckt unterschiedliche Nukleotide als Kleinbuchstaben, wenn sie
weichen von der Referenz ab, stimmen aber mit einem bekannten alternativen Allel überein
--action-if-cigar-error
Zu ergreifende Maßnahme, wenn zwischen der CIGAR-Länge und der Sequenzlänge eine Unstimmigkeit besteht
Zulässige Werte: ignorieren, Warnung (Standard), abbrechen
--read-group-id=STRING
Wert, der in das Feld „Lesegruppen-ID“ (RG-ID) eingefügt werden soll
--read-group-name=STRING
Wert, der in das Feld „Lesegruppenname“ (RG-SM) eingefügt werden soll
--read-group-library=STRING
Wert, der in das Feld der Lesegruppenbibliothek (RG-LB) eingefügt werden soll
--read-group-platform=STRING
Wert, der in das Feld der Lesegruppenbibliothek (RG-PL) eingefügt werden soll
Optionen für Qualitätsbewertungen
--quality-protocol=STRING
Protokoll für Eingabequalitätswerte. Zulässige Werte: illumina (ASCII 64-126)
(gleichwertig -J 64 -j -31) Sänger (ASCII 33-126) (entspricht -J 33 -j 0)
Standard ist Sanger (keine Druckqualitätsverschiebung)
SAM-Ausgabedateien sollten über Qualitätswerte im Sanger-Protokoll verfügen
Oder Sie können die Druckverschiebung mit diesem Flag angeben:
-j, --quality-print-shift=INT
Verschieben Sie die FASTQ-Qualitätswerte in der Ausgabe um diesen Betrag (Standard ist 0 für Sanger).
Protokoll; Um den Illumina-Eingang in den Sanger-Ausgang zu ändern, wählen Sie -31)
Optionen für externe Kartendateien
-M, --mapdir=Verzeichnis
Kartenverzeichnis
-m, --Karte=iitfile
Kartendatei. Wenn das Argument '?' (mit den Anführungszeichen),
Hier werden die verfügbaren Kartendateien aufgelistet.
-e, --mapexons
Ordnen Sie jedes Exon separat zu
-b, --mapboth
Melden Sie Treffer von beiden Genomsträngen
-u, --flankierend=INT
Flankierende Treffer anzeigen (Standard 0)
--print-commentar
Kommentarzeile für jeden Treffer anzeigen
Ausrichtungsausgabeoptionen
-N, --nolengths
Keine Intronlängen im Alignment
-I, --invertmode=INT
Modus für Alignments zum genomischen (-) Strang: 0 = cDNA nicht invertieren (Standard)
1 = cDNA invertieren und genomischen (-)-Strang drucken 2 = cDNA invertieren und genomischen (+) drucken
Strang
-i, --introngap=INT
Nukleotide werden an jedem Ende des Introns angezeigt (Standard 3)
-l, --wraplength=INT
Wickellänge für die Ausrichtung (Standard: 50)
Ausgabeoptionen filtern
--min-trimmed-coverage=FLOAT
Drucken Sie keine Ausrichtungen mit beschnittener Abdeckung abzüglich dieses Werts (Standard = 0.0).
bedeutet keine Filterung) Beachten Sie, dass chimäre Alignments unabhängig davon ausgegeben werden
Filter
--min-Identität=FLOAT
Drucken Sie keine Ausrichtungen mit einer Identität kleiner als diesem Wert (Standard = 0.0, d. h. nein).
(Filterung) Beachten Sie, dass chimäre Alignments unabhängig von diesem Filter ausgegeben werden
Hilfeoptionen
--prüfen
Überprüfen Sie die Compiler-Annahmen
--Version
Version anzeigen
--help Diese Hilfenachricht anzeigen
Andere Tools der GMAP-Suite befinden sich in /usr/lib/gmap
Verwenden Sie Gmap online über die Dienste von onworks.net