EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

Minikarte - Online in der Cloud

Führen Sie Minimap im kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist die Befehls-Minimap, die beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


Minimap – schnelle Kartierung zwischen langen DNA-Sequenzen

ZUSAMMENFASSUNG


Minikarte [-lSOV] [-k Khmer] [-w winSize] [-I BatchSize] [-d dumpFile] [-f occThres] [-r
bandbreite] [-m minGeteilt] [-c minCount] [-L minMatch] [-g maxGap] [-T StaubThres] [-t
nThreads] [-x voreingestellten] target.fa query.fa > Ausgabe.paf

BESCHREIBUNG


Minimap ist ein Tool zum effizienten Finden mehrerer ungefährer Kartierungspositionen zwischen zwei
Sätze langer Sequenzen, z. B. zwischen Lese- und Referenzgenomen, zwischen Genomen und
zwischen langen, lauten Lesevorgängen. Minimap verfügt über eine Indizierungs- und eine Kartierungsphase. In der Indizierung
In dieser Phase werden alle Minimierer eines großen Stapels von Zielsequenzen in einer Hash-Tabelle gesammelt. In
In der Mapping-Phase werden gute Cluster kolinearer Minimierertreffer identifiziert. Minimap tut es
Generieren Sie keine detaillierten Ausrichtungen zwischen dem Ziel und den Abfragesequenzen. Es nur
gibt die ungefähren Start- und Endkoordinaten dieser Cluster aus.

OPTIONAL


Indizierung Optionen
-k INT Minimierer der k-mer-Länge [15]

-w INT Minimiererfenstergröße [2/3 der k-mer-Länge]. Ein Minimierer ist das kleinste k-mer
in einem Fenster von w aufeinanderfolgenden k-meren.

-I NUM Höchstens laden NUM Zielbasen in RAM zur Indizierung [4G]. Wenn es mehr sind als
NUM Basen in target.fa, Minikarte muss gelesen werden query.fa mehrmals, um es zu kartieren
gegen jede Charge von Zielsequenzen. NUM kann mit k/K/m/M/g/G enden.

-d FILE Reduzieren Sie den Index des Minimierers auf FILE [kein Dump]

-l Weisen darauf hin, dass target.fa ist in der Tat ein durch Option generierter Minimiererindex -dnicht
eine FASTA- oder FASTQ-Datei.

Mapping Optionen
-f FLOAT Oben ignorieren FLOAT Anteil der am häufigsten auftretenden Minimierer [0.001]

-r INT Ungefähre Bandbreite für das anfängliche Minimierer-Treffer-Clustering [500]. A Minimierer
Throat Hit ist ein Minimierer, der sowohl in der Ziel- als auch in der Abfragesequenz vorhanden ist. A Minimierer
Throat Hit Gruppe ist eine Gruppe potenziell kolinearer Minimierertreffer zwischen einem Ziel
und eine Abfragesequenz.

-m FLOAT Füge anfängliche Minimierer-Treffercluster zusammen, wenn FLOAT oder höherer Anteil an Minimierern
werden zwischen den Clustern geteilt [0.5]

-c INT Behalten Sie einen Minimierer-Treffercluster bei, falls vorhanden INT oder mehr Minimierer-Treffer [4]

-L INT Verwerfen Sie einen Minimierer-Treffercluster, wenn nach der Kolinearisierung die Anzahl der Übereinstimmungen sinkt
Basen ist unten INT [40]. Diese Option reduziert hauptsächlich die Größe der Ausgabe. Es hat
wenig Einfluss auf die Geschwindigkeit und den Spitzenspeicher.

-g INT Teilen Sie einen Minimierer-Treffercluster an einer Lücke auf INT-bp oder länger, das nicht enthält
alle Minimierertreffer [10000]

-T INT Maskieren Sie Regionen in Abfragesequenzen mit dem SDUST-Score-Schwellenwert INT; 0 zum Deaktivieren
[0]. SDUST ist ein Algorithmus zur Identifizierung von Teilsequenzen geringer Komplexität. Es ist nicht
standardmäßig aktiviert. Wenn SDUST bevorzugt wird, ist ein Wert zwischen 20 und 25
empfohlen. Ein höherer Schwellenwert maskiert weniger Sequenzen.

-S Führen Sie eine All-vs-All-Zuordnung durch. In diesem Modus lautet der Name der Abfragesequenz
lexikographisch größer als der Zielsequenzname, die Treffer dazwischen
wird unterdrückt; Wenn der Name der Abfragesequenz mit dem Zielnamen übereinstimmt,
Diagonal-Minimierer-Treffer werden ebenfalls unterdrückt.

-O Lassen Sie einen Minimierer-Treffer fallen, wenn er weit von anderen Treffern entfernt ist (EXPERIMENTELL). Das
Diese Option eignet sich für die Kartierung langer Chromosomen zweier divergenter Arten.

-x STR Ändern mehrerer Einstellungen basierend auf STR [nicht eingestellt]. Es wird empfohlen, sich zu bewerben
Diese Option wird vor anderen Optionen verwendet, sodass die folgenden Optionen möglicherweise Vorrang haben
die verschiedenen Einstellungen, die durch diese Option geändert werden.

ava10k für PacBio oder Oxford Nanopore All-vs-All-Read-Mapping (-Sw5 -L100 -m0).

Eingabe / Ausgabe- Optionen
-t INT Anzahl der Threads [3]. Minimap verwendet beim Sammeln höchstens drei Threads
Minimierer für Zielsequenzen und verwendet bis zu INT+1 Threads beim Mapping (die
Ein zusätzlicher Thread ist für E/A vorgesehen, der häufig im Leerlauf ist und nur wenig CPU-Zeit beansprucht.

-V Versionsnummer auf stdout ausgeben

AUSGABE FORMAT


Minimap gibt Mapping-Positionen im Pairwise Mapping Format (PAF) aus. PAF ist ein TAB-
durch Trennzeichen getrenntes Textformat, wobei jede Zeile aus mindestens 12 Feldern besteht, wie in beschrieben
die folgende Tabelle:

┌────┬────────┬───────────────────────── ────────── ──────────────────────────┐
BeiTypBeschreibung
├────┼────────┼───────────────────────── ────────── ──────────────────────────┤
│ 1 │ Zeichenfolge │ Name der Abfragesequenz │
│ 2 │ int │ Länge der Abfragesequenz │
│ 3 │ int │ Startkoordinate abfragen (0-basiert) │
│ 4 │ int │ Endkoordinate abfragen (0-basiert) │
│ 5 │ char │ `+' wenn Abfrage und Ziel auf demselben Strang liegen; `-' wenn Gegenteil │
│ 6 │ Zeichenfolge │ Name der Zielsequenz │
│ 7 │ int │ Zielsequenzlänge │
│ 8 │ int │ Zielstartkoordinate auf dem ursprünglichen Strang │
│ 9 │ int │ Ziel-Endkoordinate auf dem ursprünglichen Strang │
│ 10 │ int │ Anzahl der passenden Basen im Mapping │
│ 11 │ int │ Zahlenbasen, einschließlich Lücken, in der Abbildung │
│ 12 │ int │ Mapping-Qualität (0-255 mit 255 für fehlend) │
└────┴────────┴───────────────────────── ────────── ──────────────────────────┘

Wenn das Alignment verfügbar ist, gibt Spalte 11 die Gesamtzahl der Sequenzübereinstimmungen an.
Nichtübereinstimmungen und Lücken in der Ausrichtung; Spalte 10 dividiert durch Spalte 11 ergibt die Ausrichtung
Identität. Da die Minikarte keine detaillierte Ausrichtung generiert, sind es diese beiden Spalten
ungefähr. PAF kann optional zusätzliche Felder im SAM-ähnlichen typisierten Schlüsselwert haben
Format. Minimap schreibt die Anzahl der Minimierer-Treffer in einem Cluster in das cm-Tag.

Nutzen Sie die Minikarte online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad