EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

cmbuild – Online in der Cloud

Führen Sie cmbuild im kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehl cmbuild, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


cmbuild – Konstruieren Sie Kovarianzmodelle aus strukturell annotierten RNA-Mehrfachsequenzen
Ausrichtung(en)

ZUSAMMENFASSUNG


cmaufbau [Optionen]

BESCHREIBUNG


Für jede Mehrfachsequenzausrichtung in Erstellen Sie ein Kovarianzmodell und speichern Sie es
eine neue Datei .

Die Ausrichtungsdatei muss im Stockholm- oder SELEX-Format vorliegen und einen Konsens enthalten
Anmerkung zur Sekundärstruktur. cmaufbau verwendet die Konsensstruktur, um die zu bestimmen
Architektur des CM.

kann '-' (Gedankenstrich) sein, was bedeutet, dass diese Eingabe von gelesen wird Standard statt einer Datei.
Um „-“ zu verwenden, müssen Sie auch das Ausrichtungsdateiformat mit angeben --informatieren , wie in
--informatieren Stockholm (aufgrund einer aktuellen Einschränkung in unserer Implementierung, MSA-Datei
Formate können in einem nicht zurückspulbaren Eingabestream nicht automatisch erkannt werden.)

möglicherweise nicht '-' (Standardausgabe), weil die CM-Datei an gesendet wird stdout würde in Konflikt geraten
mit der anderen Textausgabe des Programms.

Zusätzlich zum Schreiben von CM(s) an , cmaufbau gibt außerdem jeweils eine einzelne Zeile aus
Modell wurde auf stdout erstellt. Jede Zeile enthält die folgenden Felder: „aln“: der Index des
Ausrichtung, die zum Aufbau des CM verwendet wurde; „idx“: der Index des CM im ; "Name":
der Name des CM; „nseq“: die Anzahl der Sequenzen im Alignment, die zum Aufbau des CM verwendet werden;
„eff_nseq“: die effektive Anzahl von Sequenzen, die zum Aufbau des Modells verwendet werden; „alen“: die Länge
der Ausrichtung, die zum Aufbau des CM verwendet wurde; „clen“: die Anzahl der Spalten aus dem Alignment
definiert als Konsensspalten (Übereinstimmungsspalten); „bps“: die Anzahl der Basenpaare im CM; „Bifs“:
die Anzahl der Bifurkationen im CM; „rel entropy: CM“: die gesamte relative Entropie des
Modell geteilt durch die Anzahl der Konsensspalten; „rel entropy: HMM“: die Gesamtrelative
Entropie des Modells unter Berücksichtigung der Sekundärstruktur geteilt durch die Anzahl der Konsens
Säulen. „Beschreibung“: Beschreibung des Modells/der Ausrichtung.

OPTIONAL


-h Hilfe; Drucken Sie eine kurze Erinnerung an die Verwendung der Befehlszeile und die verfügbaren Optionen.

-n Benennen Sie den neuen CM . Standardmäßig wird der Name der Ausrichtung verwendet (falls vorhanden).
anwesend in der ), oder, falls dies nicht der Fall ist, der Name des . If
enthält mehr als eine Ausrichtung, -n funktioniert nicht, und jede Ausrichtung
muss einen Namen mit Anmerkungen versehen haben (wie in Stockholm #=GF-ID-Anmerkung).

-F Erlauben überschrieben werden. Ohne diese Option, wenn bereits
existiert, cmaufbau wird mit einem Fehler beendet.

-o Leiten Sie die Zusammenfassungsausgabe in eine Datei um , anstatt zu stdout.

-O Nachdem jedes Modell erstellt wurde, speichern Sie die mit Anmerkungen versehenen Quellausrichtungen erneut in einer Datei
im Stockholmer Format. Sequenzen werden mit den relativen Sequenzgewichten versehen
wurden zugeordnet. Die Achsen werden außerdem mit einer Referenzanmerkungslinie beschriftet
Angabe, welche Spalten als Konsens zugewiesen wurden. Wenn die Quellausrichtung hatte
Referenzanmerkung („#=GC RF“) wird durch den Konsensrest von ersetzt
das Modell für Konsensspalten und '.' für Einfügespalten, es sei denn, die --Hand
Die Option wurde für die Festlegung von Konsenspositionen verwendet. In diesem Fall wird dies der Fall sein
unverändert.

--devhelp Drucken Sie die Hilfe aus, wie bei -h , umfassen aber auch Expertenoptionen, die es nicht sind
angezeigt mit -h . Es wird nicht erwartet, dass diese Expertenoptionen für die relevant sind
Die meisten Benutzer sind davon betroffen und werden daher nicht in der Handbuchseite beschrieben. Nur
Ressourcen zum Verständnis dessen, was sie tatsächlich tun, sind die kurzen einzeiligen Texte
Beschreibungen werden ausgegeben, wenn --devhelp aktiviert ist, und der Quellcode.

OPTIONAL STEUERN MODELL AUFBAU


Diese Optionen steuern, wie Konsensspalten in einem Alignment definiert werden.

--schnell Definieren Sie Konsensspalten automatisch als Spalten mit einem Bruch >= symfrak of
Rückstände statt Lücken. (Siehe unten für die --symfrac Option.) Dies ist die
default.

--Hand Verwenden Sie die Referenzkoordinatenanmerkung (#=GC RF-Linie, in Stockholm), um zu bestimmen, welche
Spalten sind Konsens und welche sind Einfügungen. Jedes Zeichen, das keine Lücke enthält, weist auf a hin
Konsensspalte. (Markieren Sie beispielsweise Konsensspalten mit „x“ und fügen Sie Spalten ein
mit „.“) Diese Option wurde aufgerufen --rf in früheren Versionen von Infernal (0.1
bis 1.0.2).

--symfrac
Definieren Sie den Schwellenwert für die Rückstandsfraktion, der erforderlich ist, um eine Konsensspalte zu definieren, wenn
nicht verwenden --Hand. Der Standardwert ist 0.5. Der Symbolbruch in jeder Spalte ist
wird unter Berücksichtigung der relativen Sequenzgewichtung berechnet. Stellen Sie dies auf
0.0 bedeutet, dass jede Ausrichtungsspalte als Konsens zugewiesen wird, was der Fall sein kann
in manchen Fällen nützlich. Wenn Sie den Wert auf 1.0 setzen, werden nur Spalten angezeigt, die 0 Lücken enthalten
werden als Konsens vergeben. Diese Option ersetzt die --gapthresh zu erhalten
aus früheren Versionen von Infernal (0.1 bis 1.0.2), mit gleich (1.0 -
). Zum Beispiel, um das Verhalten für einen Befehl zu reproduzieren cmaufbau --gapthresh 0.8
in einer früheren Version verwenden cmaufbau --symfrac 0.2 mit dieser Variante.

--noss Ignorieren Sie gegebenenfalls die Sekundärstrukturanmerkung in und baue ein CM mit
null Basenpaare. Dieses Modell ähnelt einem Profil-HMM und dem cmsuche und
cmscan Programme verwenden hierfür HMM-Algorithmen, die schneller sind als CM-Algorithmen
Modell. Darüber hinaus muss kein Null-Basenpaar-Modell kalibriert werden cmkalibrieren
vor dem Laufen cmsuche damit. Die --noss Wenn nicht, muss die Option verwendet werden
Sekundärstrukturanmerkung in .

--research
Parametrisieren Sie Emissionswerte a la RSEARCH, indem Sie die RIBOSUM-Matrix in der Datei verwenden .
Mit der --research aktiviert, alle Ausrichtungen in muss genau einen enthalten
Sequenz oder die --Anruf Die Option muss ebenfalls aktiviert sein. Alle Positionen in jeder Sequenz
werden als Konsens-„Spalten“ betrachtet. Eigentlich die Emissionswerte für diese
Aufgrund von Unterschieden in der Modellierung sind die Modelle nicht mit den RIBOSUM-Scores identisch
Strategie zwischen Infernal und RSEARCH, aber sie werden so ähnlich wie möglich sein.
RIBOSUM-Matrixdateien sind in Infernal im Unterverzeichnis „matrices/“ enthalten
das oberste Verzeichnis „infernal-xxx“. RIBOSUM-Matrizen sind Substitutionswerte
Matrizen, die speziell für strukturelle RNAs mit separaten Einzelsträngen trainiert wurden
Rest- und Basenpaarsubstitutionswerte. Weitere Informationen finden Sie in der RSEARCH
Veröffentlichung (Klein und Eddy, BMC Bioinformatics 4:44, 2003).

anderes MODELL AUFBAU OPTIONAL


--Null
Lesen Sie ein Nullmodell aus . Das Nullmodell definiert die Wahrscheinlichkeit jeder RNA
Wenn Sie in der Hintergrundsequenz ein Nukleotid angeben, wird standardmäßig 0.25 für jedes Nukleotid verwendet.
Das Format von Nulldateien ist im Benutzerhandbuch angegeben.

--frühere
Lesen Sie vorher ein Dirichlet von , Ersetzen der Standardmischung Dirichlet. Der
Das Format früherer Dateien ist im Benutzerhandbuch angegeben.

Verwenden Sie die --devhelp um weitere, ansonsten nicht dokumentierte Modellbaumöglichkeiten zu sehen.

OPTIONAL STEUERN RELATIV WEIGHTS


cmaufbau verwendet einen Ad-hoc-Sequenzgewichtungsalgorithmus, um eng verwandte Daten herunterzugewichten
Sequenzen und Upweight entfernt verwandte Sequenzen. Dies hat zur Folge, dass die Modelle kleiner werden
voreingenommen durch ungleichmäßige phylogenetische Darstellung. Zum Beispiel würden zwei identische Sequenzen
Normalerweise erhält jeder die Hälfte des Gewichts wie eine Sequenz. Diese Optionen steuern
welcher Algorithmus verwendet wird.

--wpb Verwenden Sie das positionsbasierte Sequenzgewichtungsschema von Henikoff [Henikoff und Henikoff,
J.Mol. Biol. 243: 574, 1994]. Dies ist die Standardeinstellung.

--wgsc Verwenden Sie den Gerstein/Sonnhammer/Chothia-Gewichtungsalgorithmus [Gerstein et al., J. Mol.
Biol. 235: 1067, 1994].

--wnone
Sequenzgewichtung ausschalten; Setzen Sie beispielsweise alle Sequenzgewichte explizit auf 1.0.

--wgiven
Verwenden Sie Sequenzgewichte wie in der Anmerkung in der Eingabe-Alignment-Datei angegeben. Wenn nein
Es wurden Gewichte angegeben. Gehen Sie davon aus, dass sie alle 1.0 sind. Standardmäßig wird „Neu“ ermittelt
Sequenzgewichte durch den Gerstein/Sonnhammer/Chothia-Algorithmus, wobei alle ignoriert werden
kommentierte Gewichte.

--wblosum
Verwenden Sie zum Gewichten der Sequenzen den BLOSUM-Filteralgorithmus anstelle des Standardalgorithmus
GSC-Gewichtung. Clustern Sie die Sequenzen mit einem bestimmten Identitätsprozentsatz (siehe --wid);
Weisen Sie jedem Cluster eine Gesamtgewichtung von 1.0 zu, die gleichmäßig auf die Mitglieder verteilt ist
dieses Clusters.

--breit
Steuert das Verhalten des --wblosum Gewichtungsoption durch Festlegen des Prozentsatzes
Identität zum Clustern der Ausrichtung .

OPTIONAL STEUERN EFFEKTIVER SEQUENCE NUMBER


Nachdem die relativen Gewichte bestimmt wurden, werden sie normalisiert, um eine Summe effektiver
Sequenznummer, eff_nseq. Diese Zahl kann die tatsächliche Anzahl der Sequenzen in der sein
Ausrichtung, aber es ist fast immer kleiner. Die standardmäßige Entropiegewichtung
Methode (--eent) reduziert die effektive Sequenznummer, um den Informationsgehalt zu reduzieren
(relative Entropie oder durchschnittlicher erwarteter Wert bei echten Homologen) pro Konsensusposition. Die
Die relative Zielentropie wird durch eine Zweiparameterfunktion gesteuert, wobei die beiden
Parameter sind einstellbar mit --ehe und --esigma.

--eent Verwenden Sie die Entropiegewichtungsstrategie, um die effektive Sequenznummer zu bestimmen
Gibt eine relative Zielentropie für den mittleren Übereinstimmungszustand an. Diese Option ist die Standardeinstellung und
kann mit ausgeschaltet werden --enon. Der standardmäßige mittlere Übereinstimmungsstatus des Ziels ist relativ
Die Entropie beträgt 0.59 Bit für Modelle mit mindestens 1 Basenpaar und 0.38 Bit für Modelle
mit null Basenpaaren, aber verändert mit --ehe. Der Standardwert beträgt 0.59 oder 0.38 Bit
automatisch geändert, wenn die gesamte relative Entropie des Modells (summiert) übereinstimmt
relative Entropie des Zustands) ist kleiner als ein Grenzwert, der standardmäßig 6.0 Bit beträgt, aber
kann beim Sachverständigen geändert werden, undokumentiert --ex Möglichkeit. Wenn du es wirklich willst
Spielen Sie mit dieser Option und konsultieren Sie den Quellcode.

--enon
Schalten Sie die Entropiegewichtungsstrategie aus. Die effektive Sequenznummer ist genau die
Anzahl der Sequenzen im Alignment.

--ehe
Legen Sie die relative Entropie des Zielmittelwerts für den Übereinstimmungszustand fest als . Standardmäßig das Ziel
Die relative Entropie pro Übereinstimmungsposition beträgt 0.59 Bit für Modelle mit mindestens 1
Basenpaar und 0.38 für Modelle mit null Basenpaaren.

--emenseq
Definieren Sie die minimal zulässige effektive Sequenznummer als .

--ehmmre
Legen Sie die mittlere relative Entropie des Ziel-HMM-Übereinstimmungszustands fest als . Entropie für
Die Basenpaar-Übereinstimmungszustände werden mithilfe der marginalisierten Basenpaaremission berechnet
Wahrscheinlichkeiten.

--eset
Legen Sie die effektive Sequenznummer für die Entropiegewichtung fest als .

OPTIONAL STEUERN FILTER P7 HMM AUFBAU


Für jeden CM das cmaufbau Konstrukte, ein begleitender Filter p7 HMM wird aus der Eingabe erstellt
auch die Ausrichtung. Diese Optionen steuern die Filter-HMM-Konstruktion:

--p7ere
Legen Sie die relative Zielentropie des mittleren Übereinstimmungszustands für den Filter p7 HMM fest als . By
Standardmäßig beträgt die angestrebte relative Entropie pro Übereinstimmungsposition 0.38 Bit.

--p7ml Verwenden Sie als Filter-HMM ein aus dem CM erstelltes Maximum-Likelihood-p7-HMM. Dieses HMM wird
dem CM so ähnlich wie möglich sein (wobei er notwendigerweise keine Kenntnis von der Sekundärseite hat).
Struktur).

Verwenden Sie die --devhelp um zusätzliche, ansonsten nicht dokumentierte Filter-HMM-Konstruktionsoptionen anzuzeigen.

OPTIONAL STEUERN FILTER P7 HMM KALIBRIERUNG


Nachdem jedes Filter-HMM erstellt wurde, cmaufbau bestimmt die geeigneten zu verwendenden E-Wert-Parameter
beim Einfiltern cmsuche und cmscan indem Sie eine Reihe von Sequenzen abtasten und durchsuchen
mit jeder HMM-Filterkonfiguration und jedem Algorithmus.

--EmN Stellen Sie die Anzahl der abgetasteten Sequenzen für die HMM-Kalibrierung des lokalen MSV-Filters auf ein .
200 standardmäßig.

--EvN Stellen Sie die Anzahl der abgetasteten Sequenzen für die lokale Viterbi-Filter-HMM-Kalibrierung auf ein
. 200 standardmäßig.

--ElfN Stellen Sie die Anzahl der abgetasteten Sequenzen für die lokale Vorwärtsfilter-HMM-Kalibrierung auf ein
. 200 standardmäßig.

--EgfN Legen Sie die Anzahl der abgetasteten Sequenzen für die HMM-Kalibrierung des glokalen Vorwärtsfilters fest
zu . 200 standardmäßig.

Verwenden Sie die --devhelp um zusätzliche, ansonsten nicht dokumentierte Filter-HMM-Kalibrierungsoptionen anzuzeigen.

OPTIONAL FÜR VERFEINERUNG SPEISUNG AUSRICHTUNG


--verfeinern
Versuchen Sie, die Ausrichtung zu verfeinern, bevor Sie das CM erstellen, indem Sie Erwartungswerte verwenden.
Maximierung (EM). Ein CM wird zunächst wie üblich aus der anfänglichen Ausrichtung erstellt. Dann,
Die Sequenzen im Alignment werden optimal neu ausgerichtet (mit dem HMM-gebänderten CYK).
Algorithmus, optimal bedeutet optimal angesichts der Bänder) zum CM, und ein neuer CM wird erstellt
aus der resultierenden Ausrichtung. Die Sequenzen werden dann an das neue CM angepasst und a
Aus dieser Ausrichtung wird ein neuer CM erstellt. Dies wird bis zur Konvergenz fortgesetzt,
insbesondere, wenn die Ausrichtungen für zwei aufeinanderfolgende Iterationen nicht der Fall sind
deutlich unterschiedlich (die summierten Bitwerte aller Sequenzen in der
Ausrichtungsänderungen weniger als 1 % zwischen zwei aufeinanderfolgenden Iterationen). Das endgültige
Ausrichtung (die Ausrichtung, die zum Erstellen des CM verwendet wird, auf den geschrieben wird ) is
geschrieben .

-l Mit der --verfeinern, Aktivieren Sie den lokalen Ausrichtungsalgorithmus, der die Ausrichtung ermöglicht
überspannen bei Bedarf zwei oder mehr Teilsequenzen (z. B. wenn die Strukturen der Abfrage
Modell und Zielsequenz werden nur teilweise gemeinsam genutzt), sodass bestimmte große
Einfügungen und Löschungen in der Struktur werden anders als normal bestraft
Indels. Standardmäßig wird das Abfragemodell global an den Zielsequenzen ausgerichtet.

--gibbs
Ändert das Verhalten von --verfeinern Daher wird Gibbs-Sampling anstelle von EM verwendet. Der
Der Unterschied besteht darin, dass die Ausrichtung während der Ausrichtungsphase nicht unbedingt erfolgt
Optimal, stattdessen wird ein Alignment (Parsetree) für jede Sequenz aus dem abgetastet
posteriore Verteilung der Ausrichtungen, wie durch den Inside-Algorithmus bestimmt. Wegen
Dieser Probenahmeschritt --gibbs ist nicht deterministisch, also laufen unterschiedliche mit dem gleichen
Die Ausrichtung kann zu unterschiedlichen Ergebnissen führen. Dies gilt nicht, wenn --verfeinern verwendet wird
ohne das --gibbs Option, in diesem Fall sind die endgültige Ausrichtung und das CM immer gültig
das gleiche. Wenn --gibbs aktiviert ist, die --Samen Option kann zum Seeding verwendet werden
Zufallszahlengenerator vorhersehbar und macht die Ergebnisse reproduzierbar. Das Ziel von
--gibbs Die Option besteht darin, erfahrenen RNA-Alignment-Kuratoren bei der Verfeinerung der Struktur zu helfen
Ausrichtungen, indem es ihnen ermöglicht wird, alternative Ausrichtungen mit hoher Punktzahl zu beobachten.

--Samen
Setzen Sie den Zufallszahlengenerator mit , eine Ganzzahl >= 0. Diese Option kann nur
in Kombination mit verwendet werden --gibbs. If ist eine stochastische Stichprobe ungleich Null von
Ausrichtungen werden reproduzierbar sein; Der gleiche Befehl führt zu den gleichen Ergebnissen. Wenn
Ist 0, wird der Zufallszahlengenerator willkürlich und stochastisch gesät
Die Stichproben können von Ausführung zu Ausführung desselben Befehls variieren. Der Standardstartwert ist 0.

--cyk Mit der --verfeinern, am CYK-Algorithmus ausrichten. Standardmäßig die optimale Genauigkeit
Algorithmus verwendet wird. Weitere Informationen hierzu gibt es im bösartig Handbuchseite.

--notrunc
Mit der --verfeinern, Deaktivieren Sie den abgeschnittenen Ausrichtungsalgorithmus. Es gibt mehr
Informationen dazu im bösartig Handbuchseite.

Verwenden Sie die --devhelp um zusätzliche, ansonsten nicht dokumentierte Optionen zur Ausrichtungsverfeinerung anzuzeigen als
sowie andere Ausgabedateioptionen und Optionen zum Erstellen mehrerer Modelle für ein einzelnes
Ausrichtung.

Verwenden Sie cmbuild online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

  • 1
    Büroetage
    Büroetage
    OfficeFloor bietet eine Umkehrung von
    Kopplungssteuerung mit ihren: - Abhängigkeiten
    Einspritzung - Fortsetzungseinspritzung -
    Fadeninjektion Weitere Informationen
    Besuche den...
    Laden Sie OfficeFloor herunter
  • 2
    DivKit
    DivKit
    DivKit ist ein servergesteuertes Open-Source-Programm
    UI (SDUI)-Framework. Es ermöglicht Ihnen
    Bereitstellung serverbasierter Updates für
    verschiedene App-Versionen. Es kann auch sein
    verwendet für...
    Laden Sie DivKit herunter
  • 3
    Unterkonverter
    Unterkonverter
    Dienstprogramm zum Konvertieren zwischen verschiedenen
    Abonnementformat. Shadowrocket-Benutzer
    sollte ss, ssr oder v2ray als Ziel verwenden.
    Sie können &remark= hinzufügen
    Telegram-like HT...
    Unterkonverter herunterladen
  • 4
    SWASH
    SWASH
    SWASH ist eine Allzweck-Zahl
    Werkzeug zur Simulation instationärer,
    nicht hydrostatisch, freiflächig,
    Rotationsströmungs- und Transportphänomene
    in Küstengewässern als ...
    Laden Sie SWASH herunter
  • 5
    VBA-M (Archiviert – Jetzt auf Github)
    VBA-M (Archiviert – Jetzt auf Github)
    Projekt ist umgezogen
    https://github.com/visualboyadvance-m/visualboyadvance-m
    Features: Cheat-Erstellung, Staaten speichern, Multi
    system, unterstützt gba, gbc, gb, sgb,
    sgb2Tu...
    VBA-M herunterladen (archiviert – jetzt auf Github)
  • 6
    Stacer
    Stacer
    Linux-Systemoptimierung und -überwachung
    Github-Repository:
    https://github.com/oguzhaninan/Stacer.
    Zielgruppe: Endbenutzer/Desktop. Benutzer
    Schnittstelle: Qt. Programmierung La ...
    Staker herunterladen
  • Mehr »

Linux-Befehle

Ad