Dies ist der Befehl mhap, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
mhap – probabilistische Sequenzüberlappung
BESCHREIBUNG
Bitte stellen Sie die ein -s oder im -p Optionen. Siehe Optionen unten: MHAP: MinHash Alignment Protocol.
Ein Tool zum Auffinden von Überlappungen lang gelesener Sequenzen (wie PacBio oder Nanopore) in
Bioinformatik.
Version: 1.6, Erstellungszeit: 09 12:2015 Uhr Verwendung 11 (direkte Ausführung): Java
-Server -Xmx -Krug -s[-Q
Datei>] [-f ] Verwendung 2 (vorberechnet generieren
Binärdateien): Java -Server -Xmx -Krug -p
-q [-F ]
--Ausrichtung, Standard = falsch
Experimentelle Option.
--alignment-offset, Standard = -0.535
Der Offset zur Berücksichtigung der Varianz im Alignment-Match-Score.
--alignment-score, Standard = 1.0E-6
Der Cutoff-Wert für Ausrichtungsübereinstimmungen.
--filter-threshold, Standard = 1.0E-5
[double], der Cutoff, bei dem das k-mer in der k-mer-Filterdatei berücksichtigt wird
repetitiv. Dieser Wert für ein bestimmtes k-mer wird in der zweiten Spalte in angegeben
die Filterdatei. Wenn keine Filterdatei bereitgestellt wird, wird diese Option ignoriert.
--help, Standard = falsch
Zeigt das Hilfemenü an.
--max-shift, Standard = 0.2
[double], Regionsgröße links und rechts der geschätzten Überlappung, wie abgeleitet
aus der mittleren Verschiebung und der Sequenzlänge, wobei ein k-mer noch Übereinstimmungen aufweist
als gültig angesehen. Nur Filter der zweiten Stufe.
--min-store-length, Standard = 0
[int], Die Mindestlänge des Lesevorgangs, der in der Box gespeichert wird. Wird zum Herausfiltern verwendet
Kurze Lesevorgänge aus der FASTA-Datei.
--nanoporenschnell, Standard = falsch
Stellen Sie alle Parameter für die Nanopore-Schnelleinstellungen ein. Das ist das aktuell Beste
Richtlinien und können jederzeit ohne Vorwarnung geändert werden.
--kein-selbst, Standard = falsch
Berechnen Sie nicht die Überlappungen zwischen Sequenzen innerhalb einer Box. Sollte verwendet werden, wenn die
to- und from-Sequenzen stammen aus verschiedenen Dateien.
--num-hashes, Standard = 512
[int], Anzahl der Min-Mer, die in MinHashing verwendet werden sollen.
--num-min-matches, Standard = 3
[int], minimale Anzahl von Minuten, die geteilt werden müssen, bevor der Filter der zweiten Stufe berechnet wird.
Alle Sequenzen unterhalb dieses Wertes gelten als nicht überlappend.
--num-threads, Standard = 12
[int], Anzahl der für die Berechnung zu verwendenden Threads. Normalerweise auf 2 x #Kerne eingestellt.
--pacbio-fast, Standard = falsch
Stellen Sie alle Parameter für die PacBio-Schnelleinstellung ein. Das ist das aktuell Beste
Richtlinien und können jederzeit ohne Vorwarnung geändert werden.
--pacbio-sensitiv, Standard = falsch
Legen Sie alle Parameter für die PacBio-empfindlichen Einstellungen fest. Das ist das aktuell Beste
Richtlinien und können jederzeit ohne Vorwarnung geändert werden.
--store-full-id, Standard = falsch
Speichern Sie vollständige IDs wie in der FASTA-Datei angezeigt, anstatt nur die Sequenz zu speichern
Position in der Datei. Einige FASTA-Dateien haben lange IDS, was die Ergebnisausgabe verlangsamt.
Diese Option wird ignoriert, wenn das komprimierte Dateiformat verwendet wird.
--Schwelle, Standard = 0.04
[double], der Schwellenwert für die Ähnlichkeitsbewertung für die Sortier-Zusammenführung der zweiten Stufe
Filter. Dies basiert auf der durchschnittlichen Anzahl von k-meren, die in der Überlappung übereinstimmen
Region.
--Version, Standard = falsch
Zeigt die Version und Build-Zeit an.
--gewichtet, Standard = falsch
Führen Sie gewichtetes MinHashing durch.
-f, default = ""
K-Mer-Filterdatei, die zum Herausfiltern sich stark wiederholender K-Mer verwendet wird. Muss sortiert werden
in absteigender Reihenfolge der Häufigkeit (zweite Spalte).
-h, Standard = falsch
Zeigt das Hilfemenü an.
-k, Standard = 16
[int], k-mer-Größe, die für MinHashing verwendet wird. Die k-mer-Größe für den Filter der zweiten Stufe beträgt
getrennt und können nicht geändert werden.
-p, default = ""
Nur Verwendung 2. Das Verzeichnis mit den FASTA-Dateien, in die konvertiert werden soll
Binärformat zur Speicherung.
-q, default = ""
Verwendung 1: Die FASTA-Datei mit Lesevorgängen oder ein Verzeichnis mit Dateien, mit denen verglichen wird
die Menge der Lesevorgänge in der Box (siehe -s). Verwendung 2: Das Ausgabeverzeichnis für die Binärdatei
formatierte DAT-Dateien.
-s, default = ""
Nur Verwendung 1. Die FASTA- oder binäre DAT-Datei (siehe Verwendung 2) der Lesevorgänge, die durchgeführt werden sollen
in einer Box gespeichert und mit allen nachfolgenden Lesevorgängen verglichen.
Nutzen Sie mhap online über die Dienste von onworks.net