EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

cmkalibrieren – Online in der Cloud

Führen Sie cmkalibrate beim kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Hierbei handelt es sich um den Befehl cmkalibrieren, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


cmkalibrieren – Passen Sie exponentielle Enden für die E-Wert-Bestimmung des Kovarianzmodells an

ZUSAMMENFASSUNG


cmkalibrieren [Optionen] cmfile

BESCHREIBUNG


cmkalibrieren bestimmt exponentielle Tail-Parameter für die E-Wert-Bestimmung durch Generierung
Zufallssequenzen, durchsucht sie mit dem CM und sammelt die Ergebnisse der Ergebnisse
Treffer. Ein Histogramm der Bitwerte der Treffer wird an einen exponentiellen Schwanz angepasst und die
Parameter des angepassten Schwanzes werden in der CM-Datei gespeichert. Die exponentiellen Tail-Parameter
werden dann verwendet, um die statistische Signifikanz der gefundenen Treffer abzuschätzen cmsuche und
cmscan.

Eine CM-Datei muss mit kalibriert werden cmkalibrieren bevor es verwendet werden kann cmsuche or cmscan,
mit einer einzigen Ausnahme: Es ist nicht erforderlich, CM-Dateien zu kalibrieren, die nur enthalten
Modelle mit null Basenpaaren vor dem Ausführen cmsearch.

cmkalibrieren ist sehr langsam. Die Kalibrierung einer einzelnen durchschnittlichen Größe dauert ein paar Stunden
CM auf einer einzelnen CPU. cmkalibrieren läuft bei Infernal parallel auf allen verfügbaren Kernen
wurde auf einem System erstellt, das POSIX-Threading unterstützt (siehe Abschnitt „Installation“)
Weitere Informationen finden Sie im Benutzerhandbuch. Benutzen Kerne ergeben ungefähr -Falten
Beschleunigung im Vergleich zu einer einzelnen CPU. MPI (Message Passing Interface) kann ebenfalls verwendet werden
Parallelisierung mit dem --mpi Option, wenn Infernal mit aktiviertem MPI erstellt wurde, aber verwendet wird
Mehr als 161 Prozessoren werden nicht empfohlen, da eine Erhöhung über 161 hinaus keine Beschleunigung bewirkt
die Kalibrierung. Weitere Informationen finden Sie im Abschnitt „Installation“ des Benutzerhandbuchs.

Das --Vorhersage Mit dieser Option können Sie abschätzen, wie lange die Ausführung des Programms dauern wird
gegeben cmfile auf der aktuellen Maschine. Um die Laufzeit vorherzusagen Prozessoren mit
MPI, verwenden Sie zusätzlich die --nforecast .

Die gesuchten Zufallssequenzen cmkalibrieren werden von einem HMM generiert, auf dem trainiert wurde
echte Genomsequenzen mit verschiedenen GC-Gehalten. Das Ziel besteht darin, die GC-Verteilungen zu haben
in den Zufallssequenzen denen in tatsächlichen Genomsequenzen ähnlich sein.

Es werden vier Suchrunden und anschließende exponentielle Tail-Fits durchgeführt, jeweils eine für
die vier verschiedenen CM-Algorithmen, die verwendet werden können cmsuche und cmscan: glokales CYK,
glokales Inside, lokales CYK und lokales Inside.

Die E-Werte-Parameter werden bestimmt durch cmkalibrieren werden nur von der verwendet cmsuche und cmscan
Programme. Wenn Sie diese Programme nicht verwenden, verschwenden Sie keine Zeit mit der Kalibrierung
Ihre Modelle.

OPTIONAL


-h Hilfe; Drucken Sie eine kurze Erinnerung an die Verwendung der Befehlszeile und die verfügbaren Optionen.

-L Legen Sie die Gesamtlänge der zu durchsuchenden Zufallssequenzen fest Megabasen (Mb). Von
Standard is 1.6 MB. Zunehmend Dadurch passt der exponentielle Schwanz besser
präziser und E-Werte genauer, dauert aber länger (Verdoppelung). wird ungefähr
doppelte Laufzeit). Abnehmend wird nicht empfohlen, da dies zu Problemen führt
Passt weniger genau und die E-Werte sind weniger genau.

OPTIONAL FÜR VORHERSAGEN ERFORDERLICH ZEIT- UND SPEICHER


--Vorhersage
Sagen Sie die Laufzeit der Kalibrierung voraus cmfile (mit bereitgestellten Optionen) auf
die aktuelle Maschine und beenden Sie das Programm. Die Kalibrierung wird nicht durchgeführt. Die Vorhersagen
sollten als grobe Schätzungen betrachtet werden. Wenn Multithreading aktiviert ist (siehe
Installationsabschnitt des Benutzerhandbuchs), wird das Timing die Nummer berücksichtigen
der verfügbaren Kerne.

--nforecast
Mit der --Vorhersage, spezifizieren Sie das Für die Kalibrierung werden Prozessoren eingesetzt.
Dies kann nützlich sein, um die Laufzeit eines MPI-Laufs vorherzusagen
Prozessoren.

--memreq
Sagen Sie den für die Kalibrierung erforderlichen Speicherbedarf voraus cmfile (mit bereitgestellt
Optionen) auf dem aktuellen Computer und beenden Sie den Vorgang. Die Kalibrierung wird nicht durchgeführt.

OPTIONAL STEUERN EXPONENTIELL TAIL Passt


--gtailn
Passen Sie den exponentiellen Schwanz für glocal Inside und glocal CYK an höchste Punktzahl
im Histogrammschwanz, wo is mal die Anzahl der gesuchten MB. Der
Standardwert von ist 250. Der Wert 250 wurde gewählt, weil er gut funktioniert
empirisch relativ zu anderen Werten.

--ltailn
Passen Sie den exponentiellen Schwanz für lokales Inside und lokales CYK an höchste Punktzahl
im Histogrammschwanz, wo is mal die Anzahl der gesuchten MB. Der
Standardwert von ist 750. Der Wert 750 wurde gewählt, weil er gut funktioniert
empirisch relativ zu anderen Werten.

--tailp
Ignoriere das --gtailn und --ltailn vorangestellte Optionen und passen die Bruchteil Schwanz von
das Histogramm zu einem exponentiellen Ende, für alle Suchmodi.

OPTIONAL AUSGABE DATEIEN


--hfile
Speichern Sie die Histogramme passend in einer Datei . Das Format dieser Datei ist zwei Leerzeichen
durch Trennzeichen getrennte Spalten pro Zeile. Die erste Spalte enthält die x-Achsenwerte der Bitwerte von
jeder Behälter. Die zweite Spalte enthält die Y-Achsenwerte der Anzahl der Treffer pro Bin. Jede
Die Serie wird durch eine Zeile mit einem einzelnen Zeichen „&“ begrenzt. Die Datei enthält
eine Reihe für jede der vier exponentiellen Tail-Fits in der folgenden Reihenfolge:
glokales CYK, glokales Inside, lokales CYK und lokales Inside.

--sfile
Speichern Sie die Informationen zum Überlebensplot in einer Datei . Das Format dieser Datei ist zwei Leerzeichen
durch Trennzeichen getrennte Spalten pro Zeile. Die erste Spalte enthält die x-Achsenwerte der Bitwerte von
jeder Behälter. Die zweite Spalte enthält die Y-Achsenwerte des Anteils der Treffer, die oder erfüllen
die Punktzahl für jede Klasse überschreiten. Jede Serie wird durch eine Zeile mit einem Single begrenzt
Zeichen „&“. Die Datei enthält drei Datenreihen für jedes der vier CM
Suchmodi in der folgenden Reihenfolge: glokaler CYK, glokaler Inside, lokaler CYK und
lokal Inside. Die erste Serie ist das empirische Überlebensdiagramm aus dem Histogramm
der Treffer auf die Zufallsfolge. Die zweite Reihe ist die exponentielle Tail-Anpassung
die empirische Verteilung. Die dritte Reihe ist die exponentielle Tail-Anpassung für Lambda
wurden festgelegt und als natürlicher Logarithmus von 2 (0.691314718) festgelegt.

--qqfile
Quantil-Quantil-Diagramminformationen in einer Datei speichern . Das Format dieser Datei ist
zwei durch Leerzeichen getrennte Spalten pro Zeile. Die erste Spalte enthält die x-Achsenwerte und
Die zweite Spalte enthält die Y-Achsenwerte. Der Abstand der Punkte vom
Die Identitätslinie (y=x) ist ein Maß dafür, wie gut die exponentielle Tail-Anpassung ist
Je näher die Punkte an der Identitätslinie liegen, desto besser ist die Anpassung. Jede Serie ist
durch eine Zeile mit einem einzelnen Zeichen „&“ begrenzt. Die Datei enthält eine Serie
der empirischen Daten für jeden der vier exponentiellen Tail-Fits im Folgenden
Reihenfolge: glokaler CYK, glokaler Inside, lokaler CYK und lokaler Inside.

--ffile
Speichern Sie durch Platz getrennte Statistiken verschiedener exponentieller Tail-Fits in einer Datei .
Die Datei enthält die Lambda- und Mu-Werte für die exponentielle Tail-Anpassung
Histogrammschwänze unterschiedlicher Größe. Die Felder in der Datei sind beschriftet
informativ.

--xfile
Speichern Sie eine Liste der Ergebnisse in jedem Fit-Histogrammende in einer Datei . Jede Zeile von
Diese Datei wird eine andere Punktzahl haben, was darauf hinweist, dass im Ende ein Treffer vorhanden war
diese Punktzahl. Jede Reihe wird durch eine Zeile mit einem einzelnen Zeichen „&“ begrenzt. Der
Die Datei enthält eine Reihe für jede der vier exponentiellen Tail-Fits in der
Folgende Reihenfolge: glocal CYK, glocal Inside, local CYK und local Inside.

anderes OPTIONAL


--Samen
Setzen Sie den Zufallszahlengenerator mit , eine ganze Zahl >= 0. Wenn ist ungleich null,
stochastische Simulationen werden reproduzierbar sein; der gleiche Befehl wird das gleiche geben
Ergebnisse. Wenn 0 ist, wird der Zufallszahlengenerator willkürlich gesetzt, und
Stochastische Simulationen variieren von Ausführung zu Ausführung desselben Befehls. Der Standard
Samen ist 181.

--Beta
Standardmäßig wird das abfrageabhängige Banding (QDB) verwendet, um die CM-Suche zu beschleunigen
Algorithmen mit einer Beta-Tail-Loss-Wahrscheinlichkeit von 1E-15. Dieser Beta-Wert kann sein
gewechselt zu mit --Beta . Der Beta-Parameter ist der Betrag der Wahrscheinlichkeit
Wird die Masse bei der Bandberechnung ausgeschlossen, führen höhere Beta-Werte zu größeren Beschleunigungen
aber opfern Sie mehr Genauigkeit als niedrigere Werte. Der verwendete Standardwert ist 1E-15.
(Weitere Informationen zu QDB finden Sie bei Nawrocki und Eddy, PLoS Computational Biology
3(3): e56.)

--nicht gebändert
Schalten Sie QDB während der E-Wert-Kalibrierung aus. Dadurch wird die Kalibrierung verlangsamt.

--nonull3
Deaktivieren Sie das null3-Post-hoc-Zusatznullmodell. Dies wird nicht empfohlen, es sei denn
Sie planen, die gleiche Option zu verwenden cmsuche und / oder cmscan.

--willkürlich
Verwenden Sie stattdessen das Hintergrund-Nullmodell des CM, um die Zufallssequenzen zu generieren
des realistischeren HMM. Es sei denn, der CM wurde mit dem erstellt --Null Option zu
cmbuild, Das Hintergrund-Nullmodell beträgt jeweils 25 % für A, C, G und U.

--gc
Generieren Sie die Zufallssequenzen mithilfe der Nukleotidverteilung aus der Sequenz
Datei .

--Zentralprozessor
Geben Sie das an parallele CPU-Worker eingesetzt werden. Wenn auf „0“ gesetzt ist, dann die
Das Programm wird im seriellen Modus ausgeführt, ohne Threads zu verwenden. Sie können auch steuern
diese Zahl durch Festlegen einer Umgebungsvariablen, INFERNAL_NCPU. Diese Option wird
nur verfügbar sein, wenn die Maschine, auf der Infernal gebaut wurde, dazu in der Lage ist
POSIX-Threading (weitere Informationen finden Sie im Abschnitt „Installation“ des Benutzerhandbuchs).
Information).

--mpi Als MPI-Parallelprogramm ausführen. Diese Option ist nur verfügbar, wenn Infernal dies getan hat
wurde mit dem Flag „--enable-mpi“ konfiguriert und erstellt (siehe Installation
Weitere Informationen finden Sie im Abschnitt des Benutzerhandbuchs.

Verwenden Sie cmkalibrieren online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad