EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

hmmsim – Online in der Cloud

Führen Sie hmmsim beim kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehl hmmsim, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


hmmsim – Punkteverteilungen auf zufälligen Sequenzen sammeln

ZUSAMMENFASSUNG


hmm [Optionen]

BESCHREIBUNG


Das hmm Das Programm generiert zufällige Sequenzen und bewertet sie mit den darin enthaltenen Modellen ,
und gibt verschiedene Arten von Histogrammen, Diagrammen und angepassten Verteilungen für das Ergebnis aus
Punkte.

hmm ist kein Hauptbestandteil des HMMER-Pakets. Die meisten Benutzer hätten keinen Grund dazu
benutze es. Es dient der Entwicklung und Erprobung der statistischen Methoden zur Bestimmung von P-Werten
und E-Werte in HMMER3. Es wurde beispielsweise verwendet, um die meisten Ergebnisse im Jahr 2008 zu generieren
Papier zur lokalen Ausrichtungsstatistik von H3 (PLoS Comp Bio 4:e1000069, 2008;
http://www.ploscompbiol.org/doi/pcbi.1000069).

Da es sich um einen Forschungsprüfstand handelt, sollten Sie nicht erwarten, dass er so robust ist wie andere
Programme im Paket. Beispielsweise können Optionen auf seltsame Weise interagieren. das haben wir nicht
weder getestet noch versucht, alle möglichen Kombinationen vorherzusehen.

Die Hauptaufgabe besteht darin, eine Maximum-Likelihood-Gumbel-Verteilung an Viterbi-Scores oder an anzupassen
Exponential Tail mit maximaler Wahrscheinlichkeit, um Forward-Scores mit hoher Punktzahl zu erzielen, und um diese zu testen
Angepasste Verteilungen gehorchen der Vermutung, dass Lambda ~ log_2 für beide Viterbi Gumbel
und der Vorwärts-Exponentialschwanz.

Die Ausgabe ist eine Zahlentabelle mit einer Zeile für jedes Modell. Vier verschiedene parametrische Passformen
Zu den Score-Daten werden getestet: (1) Maximum-Likelihood-Anpassungen an beide Standorte (mu/tau) und
Steigungsparameter (Lambda); (2) Unter der Annahme, dass Lambda = log_2 ist, passt die maximale Wahrscheinlichkeit an
Nur Standortparameter; (3) dasselbe, aber unter der Annahme eines kantenkorrigierten Lambda unter Verwendung von Strom
Verfahren in H3 [Eddy, 2008]; und (4) Verwendung beider Parameter, die durch den Strom von H3 bestimmt werden
Verfahren. Die einfache, schnelle und schmutzige Standardstatistik für die Anpassungsgüte ist „E@10“.
der berechnete E-Wert des 10. Top-Hits, der voraussichtlich bei etwa 10 liegt.

Im Einzelnen sind die Spalten der Ausgabe:

Name Name des Modells.

tailp Bruchteil der höchsten Punktzahlen, der zur Anpassung an die Verteilung verwendet wird. Für Viterbi, MSV und
Hybrid-Scores, der Standardwert ist 1.0 (eine Gumbel-Verteilung wird an alle angepasst).
Daten). Für Forward-Scores beträgt dieser standardmäßig 0.02 (ein exponentieller Tail wird angepasst).
die höchsten 2 %-Werte).

mu/tau Standortparameter für die Maximum-Likelihood-Anpassung an die Daten.

Lambda Steigungsparameter für die Maximum-Likelihood-Anpassung an die Daten.

E@10 Der E-Wert, berechnet für den 10. Highscore („E@10“) unter Verwendung des ML mu/tau
und Lambda. Per Definition wird erwartet, dass dieser bei etwa 10 liegt, wenn die E-Wert-Schätzung so wäre
genau.

mufix Standortparameter für eine Maximum-Likelihood-Anpassung mit bekannter (fester) Steigung
Parameter Lambda von log_2 (0.693).

E@10fix
Der für den 10. Rang mithilfe von mufix berechnete E-Wert und der erwartete Wert
Lambda = log_2 = 0.693.

mufix2 Standortparameter für eine Maximum-Likelihood-Anpassung mit Kanteneffektkorrektur
Lambda.

E@10fix2
Der E-Wert wurde für den 10. Rang mithilfe von mufix2 und dem Kanteneffekt berechnet.
Lambda korrigiert.

PMU Standortparameter, wie durch die Schätzverfahren von H3 bestimmt.

plambda
Steigungsparameter, wie durch die Schätzverfahren von H3 bestimmt.

pE@10 Der E-Wert wurde für den 10. Rang mithilfe von pmu und plambda berechnet.

Am Ende dieser Tabelle wird eine weitere Zeile gedruckt, die mit # beginnt und die zusammenfasst
Gesamt-CPU-Zeit, die von den Simulationen verwendet wird.

Einige der optionalen Ausgabedateien liegen im xmgrace xy-Format vor. xmgrace ist leistungsstark und frei
verfügbare Grafiksoftware.

SONSTIGES OPTIONAL


-h Hilfe; Drucken Sie eine kurze Erinnerung an die Verwendung der Befehlszeile und alle verfügbaren Optionen.

-a Erfassen Sie Statistiken zur erwarteten Viterbi-Alignment-Länge aus jeder simulierten Sequenz.
Dies funktioniert nur mit Viterbi-Scores (Standard; siehe --vit). Zwei weitere
Felder werden in der Ausgabetabelle für jedes Modell gedruckt: die mittlere Länge von Viterbi
Ausrichtungen und die Standardabweichung.

-v (Ausführlich). Drucken Sie auch die Partituren aus, eine Partitur pro Zeile.

-L Legen Sie die Länge der zufällig ausgewählten (nicht homologen) Sequenzen fest auf dem „Vermischten Geschmack“. Seine
Standard ist 100.

-N Stellen Sie die Anzahl der zufällig ausgewählten Sequenzen auf ein . Der Standardwert ist 1000.

--mpi Im MPI-Parallelmodus ausführen, unter mpirun. Es erfolgt eine Parallelisierung auf der Ebene des Sendens
ein Profil nach dem anderen an einen MPI-Workerprozess an, sodass Parallelisierung nur dann hilft, wenn
Sie haben mehr als ein Profil im , und Sie möchten mindestens so viel haben
viele Profile als MPI-Worker-Prozesse. (Nur verfügbar, wenn optionale MPI-Unterstützung vorhanden war
zur Kompilierungszeit aktiviert.)

OPTIONAL STEUERN AUSGABE


-o Speichern Sie die Hauptausgabetabelle in einer Datei anstatt es an stdout zu senden.

--eine Datei
Beim Sammeln von Viterbi-Ausrichtungsstatistiken (die -a Option) für jede Stichprobe
Sequenz, zwei Felder pro Zeile in eine Datei ausgeben : die Länge des Optimalen
Ausrichtung und der Viterbi-Bit-Score. Erfordert, dass die -a Option wird ebenfalls verwendet.

--E-Datei
Geben Sie ein Rang-gegen-E-Wert-Diagramm im XMGRACE xy-Format in eine Datei aus . Die x-Achse ist die
Rang dieser Sequenz, von der höchsten zur niedrigsten Punktzahl; Die Y-Achse ist der E-Wert
für diese Sequenz berechnet. E-Werte werden mithilfe der Standardverfahren von H3 berechnet
(dh die PMU- und Plambda-Parameter in der Ausgabetabelle). Sie erwarten ein hartes Match
zwischen Rang und E-Wert, wenn die E-Werte genau geschätzt werden.

--ffile
Geben Sie eine „Filterleistung“-Datei aus an : für jedes Modell eine Zeile mit drei Feldern:
Modellname, Anzahl der Sequenzen, die den P-Wert-Schwellenwert überschreiten, und Anteil davon
Sequenzen, die den P-Wert-Schwellenwert überschreiten. Sehen --pthresh zum Einstellen des P-Wertes
Schwellenwert, der standardmäßig 0.02 beträgt (der standardmäßige MSV-Filterschwellenwert in H3). Das P-
Die Werte werden durch die Standardprozeduren von H3 bestimmt (die Parameter pmu, plambda in
der Ausgabetabelle). Wenn alles in Ordnung ist, erwarten Sie, dass die Filterleistung gleich ist
vorhergesagte P-Wert-Einstellung des Schwellenwerts.

--pfile
Geben Sie kumulative Überlebensdiagramme (P(S>x)) in eine Datei aus im XMGRACE xy-Format. Dort
Es gibt drei Diagramme: (1) die beobachtete Punkteverteilung; (2) die maximale Wahrscheinlichkeit
angepasste Verteilung; (3) eine Maximum-Likelihood-Anpassung an den Standortparameter
(mu/tau) während
unter der Annahme, lambda=log_2.

--xfile
Geben Sie die Bitwerte als binäres Array aus Gleitkommazahlen mit doppelter Genauigkeit aus (8 Byte pro Byte).
Partitur) abzulegen . Programme wie das von Easel esl-histplot kann solche Binärdateien lesen.
Dies ist nützlich, wenn extrem große Stichprobengrößen generiert werden.

OPTIONAL STEUERN MODELL CONFIGURATION (MODUS)


H3 verwendet nur lokales Multihit-Alignment ( --fs Modus), und hier glauben wir
statistische Passungen. Lokale Ausrichtungswerte von Unihit (Smith/Waterman; --sw Modus) gehorchen auch unserem
statistische Vermutungen. Glokale Ausrichtungsstatistiken (entweder Multihit oder Unihit) sind
immer noch nicht ausreichend verstanden und nicht ausreichend angepasst.

--fs Sammeln Sie Multihit-Ergebnisse für die lokale Ausrichtung. Dies ist die Standardeinstellung. Ausrichtung als
'Fragmentsuchmodus'.

--sw Sammeln Sie lokale Unihit-Alignment-Scores. Der H3-J-Status ist deaktiviert. Ausrichtung als
„Smith/Waterman-Suchmodus“.

--ls Sammeln Sie Multihit-Scores für die glokale Ausrichtung. Bei der glokalen (globalen/lokalen) Ausrichtung ist die
Das gesamte Modell muss an einer Teilsequenz des Ziels ausgerichtet sein. Der lokale H3-Ein-/Ausgang
Übergangswahrscheinlichkeiten sind deaktiviert. „ls“ stammt aus dem historischen HMMER2
Terminologie für die lokale Multihit-Ausrichtung als „lokaler Suchmodus“.

--S Sammeln Sie glokale Unihit-Alignment-Scores. Sowohl der H3-J-Status als auch der lokale Ein-/Ausstieg
Übergangswahrscheinlichkeiten sind deaktiviert. „s“ stammt aus dem historischen HMMER2
Terminologie für die unihit-glokale Ausrichtung.

OPTIONAL STEUERN WERTUNG ALGORITHM


--vit Sammeln Sie Viterbi-Maximum-Likelihood-Alignment-Scores. Dies ist die Standardeinstellung.

--fwd Sammeln Sie Forward-Log-Odds-Likelihood-Scores, summiert über das Ausrichtungsensemble.

--hyb Sammeln Sie „Hybrid“-Ergebnisse, wie in den Artikeln von Yu und Hwa beschrieben (z. B.
Bioinformatik 18:864, 2002). Dazu gehört die Berechnung einer Forward-Matrix und die Übernahme
der maximale Zellenwert. Die Zahl selbst ist statistisch gesehen etwas unmotiviert,
Es wird jedoch erwartet, dass die Verteilung eine gut erzogene Extremwertverteilung ist
(Gümbel).

--msv Sammeln Sie MSV-Werte (Multiple Ungapped Segment Viterbi) mithilfe der H3-Hauptwerte
Beschleunigungsheuristik.

--schnell Verwenden Sie für jede der oben genannten Optionen die optimierte Produktionsimplementierung von H3 (using
SIMD-Vektorisierung). Standardmäßig werden die Implementierungen mit einem kleinen Opfer verwendet
Maß an numerischer Präzision. Dies kann zu verwirrendem Rauschen führen
statistische Simulationen und Anpassungen, also wenn man sich große Sorgen um die Genauigkeit macht
Details ist es besser, diese Geräuschquelle ausschließen zu können.

OPTIONAL STEUERN Classic Fit TAIL MASSEN FÜR FORWARD


In einigen Experimenten war es nützlich, die Forward-Scores an eine Reihe verschiedener Tails anzupassen
Massen statt nur einer. Diese Optionen bieten einen Mechanismus zum Anpassen einer gleichmäßigen
beabstandete Reihe unterschiedlicher Schwanzmassen. Für jede unterschiedliche Schwanzmasse wird eine Linie generiert
in der Ausgabe.

--tmin
Legen Sie die Untergrenze für die Schwanzmassenverteilung fest. (Der Standardwert ist 0.02 für
Standard-Einzelschwanzmasse.)

--tmax
Legen Sie die Obergrenze für die Schwanzmassenverteilung fest. (Der Standardwert ist 0.02 für
Standard-Einzelschwanzmasse.)

--tpoints
Legen Sie die Anzahl der zu beprobenden Schwanzmassen fest, beginnend mit --tmin und endet bei --tmax.
(Der Standardwert ist 1 für die standardmäßige Einzelschwanzmasse von 0.02.)

--tlinear
Probieren Sie eine Reihe von Schwanzmassen mit gleichmäßigem linearem Abstand. Die Standardeinstellung ist „use“.
einheitlicher logarithmischer Abstand.

OPTIONAL STEUERN H3 PARAMETER SCHÄTZEN METHODEN


H3 verwendet drei kurze Zufallssequenzsimulationen, um die Standortparameter abzuschätzen
die erwarteten Score-Verteilungen für MSV-Scores, Viterbi-Scores und Forward-Scores. Diese
Mit den Optionen können diese Simulationen geändert werden.

--Eml
Legt die Sequenzlänge in der Simulation fest, die den Positionsparameter mu für schätzt
MSV-E-Werte. Der Standardwert ist 200.

--EmN
Legt die Anzahl der Sequenzen in der Simulation fest, die den Positionsparameter mu . schätzt
für MSV-E-Werte. Der Standardwert ist 200.

--EvL
Legt die Sequenzlänge in der Simulation fest, die den Positionsparameter mu für schätzt
Viterbi-E-Werte. Der Standardwert ist 200.

--EvN
Legt die Anzahl der Sequenzen in der Simulation fest, die den Positionsparameter mu . schätzt
für Viterbi-E-Werte. Der Standardwert ist 200.

--EfL
Legt die Sequenzlänge in der Simulation fest, die den Positionsparameter tau . schätzt
für Forward-E-Werte. Standard ist 100.

--EfN
Legt die Anzahl der Sequenzen in der Simulation fest, die den Positionsparameter schätzt
tau für Forward-E-Werte. Standard ist 200.

--Eft
Legt den Schwanzmassenanteil so fest, dass er in die Simulation passt, die den Standort schätzt
Parameter tau für Forward-Werte. Der Standardwert ist 0.04.

FEHLERBEHEBUNG OPTIONAL


--Stall
Zum Debuggen der MPI-Master/Worker-Version: Pause nach Start, um die
Entwickler, um Debugger an die laufenden Master- und Worker-Prozesse anzuhängen. Senden
SIGCONT-Signal zum Auslösen der Pause. (Unter gdb: (GDB) Signal WEITERFORTS) (Nur
verfügbar, wenn die optionale MPI-Unterstützung zur Kompilierzeit aktiviert wurde.)

--Samen
Legen Sie den Zufallszahlen-Startwert fest auf . Der Standardwert ist 0, was die Zufallszahl ergibt
Der Generator verwendet einen beliebigen Seed, so dass unterschiedliche Läufe möglich sind hmm wird fast
sicherlich eine andere statistische Stichprobe erzeugen. Zum Debuggen ist es nützlich
Erzwingen Sie reproduzierbare Ergebnisse, indem Sie einen Zufallszahlen-Startwert festlegen.

EXPERIMENTAL OPTIONAL


Diese Optionen wurden in einer kleinen Auswahl unterschiedlicher explorativer Experimente genutzt.

--bgflat
Stellen Sie die Hintergrundrückstandsverteilung auf eine gleichmäßige Verteilung ein, sowohl für
Zwecke des Nullmodells, das bei der Berechnung von Scores verwendet wird, und zur Generierung der
zufällige Sequenzen. Standardmäßig wird eine Standard-Aminosäure-Hintergrundfrequenz verwendet
Verteilung.

--bgcomp
Stellen Sie die Hintergrundrückstandsverteilung auf die mittlere Zusammensetzung des Profils ein.
Dies wurde genutzt, um einige der Auswirkungen einer voreingenommenen Komposition zu untersuchen.

--x-no-lengthmodel
Schalten Sie das H3-Zielsequenzlängenmodell aus. Legen Sie die Selbstübergänge für N,C,J fest
und das Nullmodell stattdessen auf 350/351; Dies emuliert HMMER2. Keine gute Idee
allgemein. Dies wurde verwendet, um einen der Hauptunterschiede zwischen H2 und H3 zu demonstrieren.

--nu
Legen Sie den nu-Parameter für den MSV-Algorithmus fest – die erwartete Anzahl von nicht verknüpften lokalen
Alignments pro Zielsequenz. Der Standardwert ist 2.0, was einem E->J entspricht
Übergangswahrscheinlichkeit von 0.5. Dies wurde verwendet, um zu testen, ob variierende nu vorliegt
erhebliche Auswirkung auf das Ergebnis (im Rahmen der Vernunft scheint dies nicht der Fall zu sein). Nur diese Option
funktioniert, wenn --msv ausgewählt ist (es wirkt sich nur auf MSV aus) und es funktioniert nicht damit --schnell
(da die optimierten Implementierungen fest darauf eingestellt sind, nu=2.0 anzunehmen).

--pthresh
Legen Sie den Filter-P-Wert-Schwellenwert fest, der beim Generieren von Filterleistungsdateien verwendet werden soll
--ffile. Der Standardwert ist 0.02 (was zum Testen von MSV-Scores geeignet wäre).
da dies der standardmäßige MSV-Filterschwellenwert in der Beschleunigungspipeline von H3 ist.)
Andere geeignete Optionen (übereinstimmende Standardwerte in der Beschleunigungspipeline) wären
0.001 für Viterbi und 1e-5 für Forward.

Nutzen Sie hmmsim online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad