EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

cmemit - Online in der Cloud

Führen Sie cmemit im kostenlosen OnWorks-Hosting-Provider über Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator aus

Dies ist der Befehl cmemit, der im kostenlosen OnWorks-Hosting-Provider über eine unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


cmemit - Beispielsequenzen aus einem Kovarianzmodell

ZUSAMMENFASSUNG


cmmit [Optionen]

BESCHREIBUNG


Das cmmit Programmsamples (emittiert) Sequenzen aus dem/den Kovarianzmodell(en) in , machen
schreibt sie in die Ausgabe. Abtastsequenzen können für eine Vielzahl von Zwecken nützlich sein, z.
einschließlich der Erstellung synthetischer echter positiver Ergebnisse für Benchmarks oder Tests.

Standardmäßig werden von jedem CM zehn nicht ausgerichtete Sequenzen abgetastet. Alternativ mit dem -c
Option können Sie eine einzelne Mehrheitsregel-Konsensussequenz emittieren; oder mit dem -a Option, du
kann eine Ausrichtung aussenden.

Das kann eine Bibliothek von CMs enthalten, in welchem ​​Fall jede CM der Reihe nach verwendet wird.

kann '-' (Gedankenstrich) sein, was bedeutet, dass diese Eingabe von gelesen wird Standard statt einer Datei.

Bei Modellen mit null Basenpaaren werden stattdessen Sequenzen aus dem Profil-HMM-Filter abgetastet
des CMs. Da diese Modelle jedoch nahezu identisch sein werden (außer Sonderoptionen
wurden in verwendet cmaufbau um dies zu verhindern), wird die Verwendung des HMM anstelle des CM die
Ausgabe in signifikanter Weise, es sei denn, die -l Option verwendet wird. Mit - l, das HMM wird sein
für gleichwahrscheinliche Anfangs- und Endpositionen des Modells konfiguriert, während der CM dies nicht tut. Du kannst
Stärke cmmit um immer mit dem CM zu sampeln --nohmmonly .

OPTIONAL


-h Hilfe; Drucken Sie eine kurze Erinnerung an die Verwendung der Befehlszeile und die verfügbaren Optionen.

-o Speichern Sie die synthetischen Sequenzen in einer Datei anstatt sie auf stdout zu schreiben.

-N Generieren Sequenzen. Der Standardwert für ist 10.

-u Schreiben Sie die generierten Sequenzen im nicht ausgerichteten Format (FASTA). Dies ist die Standardeinstellung
Verhalten.

-a Schreiben Sie die generierten Sequenzen in einem ausgerichteten Format (STOCKHOLM) mit Konsens
Strukturanmerkung statt FASTA. Andere Ausgabeformate sind mit dem
--outformat .

-c Vorhersage einer einzelnen Mehrheitsregel-Konsensussequenz anstelle von Stichprobensequenzen
aus der Wahrscheinlichkeitsverteilung des CM. Hochkonservierte Reste (basengepaart
Reste, die höher als 3.0 Bits punkten, oder einzelsträngige Reste, die
größer als 1.0 Bit) werden in Großbuchstaben dargestellt; andere werden in Kleinbuchstaben angezeigt.

-e Betten Sie die von CM emittierten Sequenzen in eine größere zufällig generierte Sequenz der Länge ein
generiert aus einem HMM, das an echten genomischen Sequenzen mit verschiedenen
GC-Inhalt (das gleiche HMM, das von cmkalibrieren). Sie können die Verwendung --iid Option zu
erzeugen stattdessen 25 % A-, C-, G- und U-Sequenz. Die CM-Emissionssequenz beginnt
an einer zufälligen Position innerhalb der größeren Sequenz und wird in seine
vollständig, es sei denn, die --u5p or --u3p Optionen verwendet werden. Wann -e wird in verwendet
Kombination mit --u5p, die von CM gesendete Sequenz beginnt immer an Position 1 von
die größere Sequenz und wird 5' verkürzt. Bei Verwendung in Kombination --u3p der CM
Die ausgegebene Sequenz endet immer an Position der größeren Folge und wird
3' abgeschnitten.

-l Konfigurieren Sie die CMs in den lokalen Modus, bevor Sie Sequenzen ausgeben. Standardmäßig ist das Modell
wird im globalen Modus sein. Im lokalen Modus sind große Einfügungen und Löschungen mehr
üblicher als im globalen Modus.

OPTIONAL FÜR KÜRZEN AUSGESENDET SEQUENZEN


--u5p Alle emittierten Sequenzen an einer zufällig gewählten Startposition abschneiden , nur von
Ausgabe von Restmengen ab . Ein anderer Startpunkt wird zufällig gewählt
für jede Folge.

--u3p Alle emittierten Sequenzen an einer zufällig gewählten Endposition abschneiden , nur von
Reste ausgeben bis Position . Ein anderer Endpunkt wird zufällig gewählt
für jede Folge.

--a5p
In Kombination mit dem -a Option, kürzen Sie die ausgegebene Ausrichtung zufällig
gewählte Startspielposition , indem nur Ausrichtungsspalten für Positionen ausgegeben werden
nach dem Spielstatus - 1. muss eine ganze Zahl zwischen 0 und dem Konsens sein
Länge des Modells (die mit dem bestimmt werden kann) cmstat Programm. Als besonderes
Fall, mit 0 als führt zu einer zufällig gewählten Startposition.

--a3p
In Kombination mit dem -a Option, kürzen Sie die ausgegebene Ausrichtung zufällig
gewählte Endspielposition , indem nur Ausrichtungsspalten für Positionen ausgegeben werden
vor dem Spielstatus + 1. muss eine ganze Zahl zwischen 1 und dem Konsens sein
Länge des Modells (die mit dem bestimmt werden kann) cmstat Programm). Als ein
Sonderfall mit 0 als führt zu einer zufällig gewählten Endposition.

anderes OPTIONAL


--Samen
Setzen Sie den Zufallszahlengenerator mit , eine ganze Zahl >= 0. Wenn ist ungleich null,
stochastisches Sampling von Sequenzen wird reproduzierbar sein; der gleiche Befehl wird geben
die gleichen Ergebnisse. Wenn 0 ist, wird der Zufallszahlengenerator willkürlich gesetzt,
und stochastische Stichproben variieren von Ausführung zu Ausführung desselben Befehls. Die
Standard-Seed ist 0.

--iid Mit der -e, generieren die größeren Sequenzen als jeweils 25 % A, C, G und U.

--rna Geben Sie an, dass die emittierten Sequenzen als RNA-Sequenzen ausgegeben werden. Das ist wahr von
default.

--DNA Geben Sie an, dass die emittierten Sequenzen als DNA-Sequenzen ausgegeben werden. Standardmäßig ist die
Ausgabealphabet ist RNA.

--idx
Geben Sie an, dass die ausgegebenen Sequenzen beginnend mit benannt werden . . By
Standard ist 1.

--outformat
Mit der -a, Geben Sie das Ausgabeausrichtungsformat als . an . Zulässige Formate sind: Pfam,
AFA, A2M, Clustal und Phylip. AFA ist fasta ausgerichtet. Nur Pfam und Stockholm
Ausrichtungsformate enthalten Konsensstrukturanmerkungen.

--tfile
Speichern Sie tabellarische Sequenz-Parsetrees (Tracebacks) für jede ausgegebene Sequenz in eine Datei
. In erster Linie nützlich zum Debuggen.

--exp
Potenzieren Sie die Emissions- und Übergangswahrscheinlichkeiten des CM um und dann
Renormieren Sie diese Verteilungen, bevor Sie Sequenzen ausgeben. Diese Option ändert die
CM-Wahrscheinlichkeitsverteilung von Parserbäumen relativ zum Ausfall. Mit weniger als
1.0 tendieren die emittierten Sequenzen dazu, bei der Ausrichtung auf die
CM. Mit größer als 1.0, neigen die emittierten Sequenzen dazu, höhere Bits zu haben
punktet bei der Ausrichtung auf das CM. Dieser Bit-Score-Unterschied wird sich erhöhen, wenn
bewegt sich in beide Richtungen weiter von 1.0 weg. Wenn gleich 1.0, diese Option
hat keine Auswirkung auf den Standardwert. Diese Option ist nützlich zum Generieren von Sequenzen
die sind entweder schwieriger ( < 1.0) oder einfacher ( > 1.0) für die CM zu
als homolog vom Hintergrund unterscheiden, zufällige Sequenz.

--hmonly
Aus dem Filterprofil HMM statt des CM aussenden.

--nohmmonly
Niemals aus dem Filterprofil HMM emittieren, immer den CM verwenden, auch bei Modellen mit
Null Basenpaare.

Verwenden Sie cmemit online mit den onworks.net-Diensten


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad