EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

cmsearch – Online in der Cloud

Führen Sie cmsearch im kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehl cmsearch, der beim kostenlosen Hosting-Anbieter OnWorks über eine unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


cmsearch – Suche nach Kovarianzmodell(en) anhand einer Sequenzdatenbank

ZUSAMMENFASSUNG


cmsuche [Optionen]

BESCHREIBUNG


cmsuche wird verwendet, um ein oder mehrere Kovarianzmodelle (CMs) anhand einer Sequenz zu durchsuchen
Datenbank. Für jeden CM in , Verwenden Sie diesen Abfrage-CM, um die Zieldatenbank zu durchsuchen
Sequenzen in , und Ausgabe von Ranglisten der Sequenzen mit der höchsten Bedeutung
passt zum CM. Informationen zum Erstellen von CMs aus mehreren Ausrichtungen finden Sie unter cmbuild.

Die Abfrage muss für E-Werte mit kalibriert worden sein cmkalibrieren. Als besonderes
Ausnahme: alle Modelle in die null Basenpaare haben, müssen nicht kalibriert werden. Für
Bei diesen Modellen werden, wie besprochen, Profil-HMM-Suchalgorithmen anstelle von CM-Suchalgorithmen verwendet
Weiter unten.

Die Abfrage kann „-“ (ein Bindestrich) sein. In diesem Fall lautet die CM-Eingabe der Abfrage
lese von a Pipe statt aus einer Datei. Die darf nicht „-“ sein, weil die
Die aktuelle Implementierung muss in der Lage sein, die Datenbank zurückzuspulen, was mit nicht möglich ist
Standard Eingang.

Das Ausgabeformat ist menschenlesbar, aber oft so umfangreich, dass
es zu lesen ist unpraktisch, und es zu analysieren ist mühsam. Die --tblout Option speichert die Ausgabe in einem
einfaches Tabellenformat, das prägnant und einfacher zu analysieren ist. Der -o Option erlaubt
Umleiten der Hauptausgabe, einschließlich Wegwerfen in /dev/null.

cmsuche Untersucht die 5'- und 3'-Termini von Zielsequenzen mithilfe spezieller Algorithmen erneut
zur Erkennung von gekürzt Hits, in denen Teil des 5'- und/oder 3'-Endes des eigentlichen Full
In der Zielsequenzdatei fehlt die homologe Sequenz der Länge. Diese Art von Treffern
wird am häufigsten in Sequenzdateien vorkommen, die aus nicht zusammengesetzten Sequenzierungslesevorgängen bestehen. Von
Standardmäßig muss jeder abgeschnittene 5-Fuß-Treffer den ersten Rest des Ziels enthalten
Reihenfolge, aus der es stammt , und jeder abgeschnittene 3'-Treffer muss das enthalten
letzter Rest der Zielsequenz, von der er abgeleitet ist. Jeder abgeschnittene 5'- und 3'-Treffer muss sein
umfassen den ersten und letzten Rest der Zielsequenz, von der es abgeleitet ist. Der --anytrunc
Mit dieser Option werden die Anforderungen für die Treffereinbeziehung von Sequenzendpunkten gelockert und gekürzt
Treffer dürfen an beliebigen Positionen der Zielsequenzen beginnen und stoppen. Wichtig
allerdings, mit --anytrunc, Treffer-E-Werte sind aufgrund der Modellkalibrierung weniger genau
Berücksichtigen Sie nicht die Möglichkeit abgeschnittener Treffer und verwenden Sie es daher mit Vorsicht. Der --notrunc
Mit dieser Option kann die Erkennung abgeschnittener Treffer deaktiviert werden. --notrunc wird den Lauf verringern
Zeit cmsearch, am wichtigsten für das Ziel Dateien, die viele kurze Dateien enthalten
Sequenzen.

Die Erkennung abgeschnittener Treffer wird automatisch deaktiviert, wenn die --max, --nöhm, --qdb, or
--nicht gebändert Optionen werden verwendet, da sie auf der Verwendung eines beschleunigten HMM-Bandes beruhen
Ausrichtungsstrategie, die durch eine dieser Optionen deaktiviert wird.

OPTIONAL


-h Hilfe; Drucken Sie eine kurze Erinnerung an die Verwendung der Befehlszeile und alle verfügbaren Optionen.

-g Mach das ... an glocal Ausrichtungsalgorithmus, global in Bezug auf das Abfragemodell und
lokal in Bezug auf die Zieldatenbank. Standardmäßig die lokale Ausrichtung
Es wird ein Algorithmus verwendet, der sowohl in Bezug auf die Zielsequenz als auch in Bezug auf die lokal ist
Modell. Im lokalen Modus erstreckt sich die Ausrichtung bei Bedarf über zwei oder mehr Teilsequenzen
(z. B. wenn die Strukturen von Abfragemodell und Zielsequenz nur teilweise übereinstimmen
gemeinsam genutzt), wodurch bestimmte große Einfügungen und Löschungen in der Struktur möglich sind
werden anders bestraft als normale Indels. Der lokale Modus schneidet im empirischen Modus besser ab
Benchmarks und ist wesentlich empfindlicher für die Fernerkennung von Homologien.
Empirisch gesehen liefern glokale Suchen viel weniger Treffer als lokale Suchen, also glokal
kann für einige Anwendungen erwünscht sein. Mit -G, Alle Modelle müssen sogar kalibriert werden
diejenigen mit null Basenpaaren.

-Z Berechnen Sie die E-Werte so, als ob die Suchraumgröße gleich wäre Megabasen (Mb). Ohne das
Bei Verwendung dieser Option wird die Suchraumgröße als Gesamtzahl definiert
Nukleotide in mal 2, weil beide Stränge jeder Zielsequenz dies tun
durchsucht werden.

--devhelp
Drucken Sie die Hilfe aus, wie bei -h , enthalten aber auch Expertenoptionen, die nicht angezeigt werden
mit -h . Es wird nicht erwartet, dass diese Expertenoptionen für die Allgemeinheit relevant sind
Die meisten Benutzer sind davon betroffen und werden daher nicht in der Handbuchseite beschrieben. Die einzigen Ressourcen
Um zu verstehen, was sie tatsächlich tun, dienen die ausgegebenen kurzen einzeiligen Beschreibungen
wann --devhelp aktiviert ist, und der Quellcode.

OPTIONAL FÜR STEUERN AUSGABE


-o Leiten Sie die für Menschen lesbare Hauptausgabe in eine Datei anstelle des Standard-Standards.

-A Speichern Sie eine Mehrfachausrichtung aller signifikanten Treffer (die befriedigenden). Aufnahme
Schwellenwerte) in die Datei .

--tblout
Speichern Sie eine einfache tabellarische (durch Leerzeichen getrennte) Datei mit einer Zusammenfassung der gefundenen Treffer
Datenzeile pro Treffer. Das Format dieser Datei ist im Infernal-Benutzerhandbuch beschrieben.

- gem Verwenden Sie in der Hauptausgabe Zugriffe anstelle von Namen, sofern für Profile verfügbar
und/oder Sequenzen.

- noali
Lassen Sie den Ausrichtungsabschnitt in der Hauptausgabe weg. Dies kann die Leistung stark reduzieren
Volumen.

--nottextw
Begrenzen Sie die Länge jeder Zeile in der Hauptausgabe. Der Standardwert ist ein Limit von 120
Zeichen pro Zeile, was dazu beiträgt, die Ausgabe sauber auf Terminals anzuzeigen und
in Editoren, können aber Zielprofil-Beschreibungszeilen abschneiden.

--textw
Setzen Sie die Zeilenlängenbegrenzung des Hauptausgangs auf Zeichen pro Zeile. Die Standardeinstellung ist
120

- ausführlich
Fügen Sie zusätzliche Suchpipeline-Statistiken in die Hauptausgabe ein, einschließlich Filter
Überlebensstatistiken für die Erkennung abgeschnittener Treffer und die Anzahl der verworfenen Umschläge
aufgrund von Matrixgrößenüberläufen.

OPTIONAL STEUERN REPORTING SCHWELLEN


Berichtsschwellenwerte steuern, welche Treffer in Ausgabedateien gemeldet werden (Hauptausgabe und
--tblout) Treffer werden nach statistischer Signifikanz (E-Wert) geordnet. Standardmäßig alle Treffer
mit einem E-Wert <= 10 gemeldet. Mit den folgenden Optionen können Sie die Standardeinstellung ändern
E-Wert-Berichtsschwellenwerte oder stattdessen die Verwendung von Bit-Score-Schwellenwerten.

-E Melden Sie in der Ausgabe pro Ziel Zielsequenzen mit einem E-Wert von <= . Das
Der Standardwert ist 10.0, was bedeutet, dass im Durchschnitt etwa 10 falsch positive Ergebnisse gemeldet werden
pro Abfrage, damit Sie die Spitze des Rauschens sehen und selbst entscheiden können, ob es so ist
wirklich Lärm.

-T Anstatt die Ausgabe pro CM auf den E-Wert zu beschränken, melden Sie Zielsequenzen mit a
Bit-Score von >= .

OPTIONAL FÜR AUFNAHME SCHWELLEN


Die Aufnahmeschwellen sind strenger als die Meldeschwellen. Kontrolle der Einschlussschwellen
welche Treffer als zuverlässig genug gelten, um in ein Ausgabe-Alignment einbezogen zu werden oder
in einer möglichen nachfolgenden Suchrunde oder als bedeutsam ("!") im Gegensatz zu markiert
fragwürdig („?“) in der Trefferausgabe.

--incE
Verwenden Sie einen E-Wert von <= als Treffereinschlussschwelle. Der Standardwert ist 0.01,
Das bedeutet, dass im Durchschnitt etwa 1 falsch positives Ergebnis von 100 zu erwarten wäre
sucht mit unterschiedlichen Abfragesequenzen.

--inkl
Anstatt E-Werte zum Festlegen der Einschlussschwelle zu verwenden, verwenden Sie stattdessen ein Bit
Punktzahl von >= als Treffereinschlussschwelle. Standardmäßig ist diese Option deaktiviert.

OPTIONAL FÜR MODELLSPEZIFISCH SCORE SCHWELLE


Kuratierte CM-Datenbanken können für jedes CM spezifische Bit-Score-Schwellenwerte definieren, die alle anderen ersetzen
Schwellenwertermittlung allein auf der Grundlage der statistischen Signifikanz.

Um diese Optionen nutzen zu können, muss das Profil das entsprechende (GA, TC und/oder NC) enthalten.
optionale Anmerkung zum Bewertungsschwellenwert; das wird aufgegriffen von cmaufbau aus dem Stockholmer Format
Ausrichtungsdateien. Jede Schwellenwertoption hat eine Punktzahl von Bits und verhält sich so, als ob -T
--inkl wurde speziell unter Verwendung der kuratierten Schwellenwerte jedes Modells angewendet.

--cut_ga
Verwenden Sie die GA-Bitwerte (Sammeln) im Modell, um die Trefferberichterstattung und -einbeziehung festzulegen
Schwellenwerte. GA-Schwellenwerte gelten im Allgemeinen als zuverlässig kuratiert
Schwellenwerte, die die Familienzugehörigkeit definieren; zum Beispiel in Rfam diese Schwellenwerte
Definieren Sie, was in Rfam-Vollausrichtungen basierend auf Suchen mit Rfam Seed enthalten sein soll
Modelle.

--cut_nc
Verwenden Sie die NC-Bit-Score-Schwellenwerte (Noise Cutoff) im Modell, um die Trefferberichterstattung festzulegen
und Inklusionsschwellen. NC-Schwellenwerte gelten im Allgemeinen als die Punktzahl von
das am höchsten bewertete bekannte falsch positive Ergebnis.

--cut_tc
Verwenden Sie die TC-Bit-Score-Schwellenwerte (Trusted Cutoff) im Modell, um die Trefferberichterstattung festzulegen
und Inklusionsschwellen. Als TC-Schwellenwerte gelten im Allgemeinen die Werte von
das am niedrigsten bewertete bekannte True-Positive-Ergebnis, das vor allen bekannten False-Positives steht.

OPTIONAL STEUERN BESCHLEUNIGUNG PIPELINE


Infernal 1.1-Suchen werden in einer sechsstufigen Filterpipeline beschleunigt. Die ersten fünf
Stufen verwenden ein Profil-HMM, um Umschläge zu definieren, die an Stufe sechs CM CYK übergeben werden
Filter. Alle Umschläge, die alle Filter überstehen, werden mithilfe des CM endgültig bewertet
Insider-Algorithmus. (Weitere Informationen finden Sie im Benutzerhandbuch.)

Der Profil-HMM-Filter wird von erstellt cmaufbau Programm und wird in gespeichert .

Jeder nachfolgende Filter ist langsamer als der vorherige, aber besser als dieser
Unterscheidung zwischen Teilsequenzen, die CM-Treffer mit hoher Punktzahl enthalten können, und solchen, die dies tun
nicht. Die ersten drei HMM-Filterstufen sind die gleichen wie bei HMMER3. Stufe 1 (F1)
ist der lokale HMM-SSV-Filter, der für lange Sequenzen modifiziert wurde. Stufe 2 (F2) ist das lokale HMM
Viterbi-Filter. Stufe 3 (F3) ist der lokale HMM-Vorwärtsfilter. Jeder der ersten drei
Stages verwendet das Profil-HMM im lokalen Modus, was die Ausrichtung einer Zieluntersequenz ermöglicht
jede Region des HMM. Stufe 4 (F4) ist ein glokaler HMM-Filter, der ein Ziel erfordert
Folge zur Ausrichtung auf das HMM-Profil in voller Länge. Stufe 5 (F5) ist das glokale HMM
Hüllkurvendefinitionsfilter, der zur Definition die Domänenidentifizierungsheursitik von HMMER3 verwendet
Hüllkurvengrenzen. Nach jeder Stufe von 2 bis 5 folgt ein Bias-Filterschritt (F2b, F3b, F4b und
F5b) wird verwendet, um Sequenzen zu entfernen, die aufgrund von Voreingenommenheit den Filter anscheinend passiert haben
Komposition allein. Alle Umschläge, die die Stufen F1 bis F5b überstehen, werden dann weitergegeben
der lokale CM CYK-Filter. Der CYK-Filter verwendet von einem HMM abgeleitete Einschränkungen (Bänder).
Ausrichtung des Umschlags, um die Anzahl der erforderlichen Berechnungen zu reduzieren und Zeit zu sparen.
Alle Umschläge, die CYK bestehen, werden mit dem lokalen CM Inside-Algorithmus bewertet, wiederum unter Verwendung von HMM
Bänder zur Beschleunigung.

Die Standardfilterschwellenwerte, die die für eine Teilsequenz erforderliche Mindestpunktzahl definieren
Die Überlebenszeit jeder Stufe wird basierend auf der Größe der Datenbank definiert (oder die Größe
in Megabasen (Mb), angegeben durch die -Z or --FZ Optionen). Für größere Datenbanken
Die Filter sind strenger, was zu mehr Beschleunigung, aber möglicherweise auch zu einem größeren Verlust führt
Empfindlichkeit. Der Grund dafür ist, dass Treffer bei größeren Datenbanken höhere Punktzahlen haben müssen
Erzielen Sie statistische Signifikanz, also eine strengere Filterung, die niedrigere Bewertungen entfernt
unbedeutende Treffer sind akzeptabel.

Die P-Wert-Schwellenwerte für alle möglichen Suchraumgrößen und alle Filterstufen sind
als nächstes aufgeführt. (Ein P-Wert-Schwellenwert von 0.01 bedeutet, dass etwa 1 % der höchsten Punktzahl erreicht wird
Es wird erwartet, dass nichthomologe Teilsequenzen den Filter passieren.) Z ist definiert als die Anzahl von
Nukleotide in der vollständigen Zielsequenzdatei mal 2, da beide Stränge vorhanden sind
mit jedem Modell gesucht.

Wenn Z kleiner als 2 MB ist: F1 ist 0.35; F2 und F2b sind ausgeschaltet; F3, F3b, F4, F4b und F5 betragen 0.02;
F6 ist 0.0001.

Wenn Z zwischen 2 MB und 20 MB liegt: F1 ist 0.35; F2 und F2b sind ausgeschaltet; F3, F3b, F4, F4b und F5
sind 0.005; F6 ist 0.0001.

Wenn Z zwischen 20 MB und 200 MB liegt: F1 ist 0.35; F2 und F2b betragen 0.15; F3, F3b, F4, F4b und F5
sind 0.003; F6 ist 0.0001.

Wenn Z zwischen 200 MB und 2 GB liegt: F1 ist 0.15; F2 und F2b betragen 0.15; F3, F3b, F4, F4b, F5,
und F5b sind 0.0008; und F6 ist 0.0001.

Wenn Z zwischen 2 GB und 20 GB liegt: F1 ist 0.15; F2 und F2b betragen 0.15; F3, F3b, F4, F4b, F5 und
F5b sind 0.0002; und F6 ist 0.0001.

Wenn Z mehr als 20 GB beträgt: F1 ist 0.06; F2 und F2b betragen 0.02; F3, F3b, F4, F4b, F5 und F5b
sind 0.0002; und F6 ist 0.0001.

Diese Schwellenwerte wurden basierend auf der Leistung eines internen Benchmarktests ausgewählt
verschiedene mögliche Einstellungen.

Es gibt fünf Optionen zur Steuerung der allgemeinen Filterstufe. Diese Optionen sind in
Reihenfolge von am wenigsten streng (am langsamsten, aber am empfindlichsten) bis am strengsten (am schnellsten, aber am wenigsten).
empfindlich): --max, --nöhm, --Mitte, --Standard, (dies ist die Standardeinstellung), --rfam. und
--hmonly. Mit der --Ursprünglich Die Filterschwellenwerte hängen von der Datenbankgröße ab. Siehe die
Weitere Informationen finden Sie weiter unten in der Erläuterung jeder dieser einzelnen Optionen.

Darüber hinaus kann ein erfahrener Benutzer mit jedem Filterstufen-Score-Schwellenwert präzise steuern
--F1, --F1b, --F2, --F2b, --F3, --F3b, --F4, --F4b, --F5, --F5b, und --F6 Optionen. Als
Außerdem können Sie jede Stufe mit ein- oder ausschalten --noF1, --doF1b, --noF2, --noF2b, --noF3,
--noF3b, --noF4, --noF4b, --noF5, und --noF6. Optionen. Diese Optionen werden nur angezeigt
wenn die --devhelp Option wird verwendet, um die Anzahl der angezeigten Optionen beizubehalten -h
sinnvoll sind und weil erwartet wird, dass sie nur für eine kleine Minderheit der Benutzer nützlich sind.

Als Sonderfall für alle Modelle in die keine Basenpaare haben, Profil HMM
Suchen werden anstelle von CM-Suchen ausgeführt. HMM-Algorithmen sind effizienter als CM
Algorithmen, und der Vorteil von CM-Algorithmen geht für Modelle ohne Sekundär verloren
Struktur (null Basenpaare). Diese Profil-HMM-Suchen werden deutlich schneller ausgeführt als
Der CM sucht. Sie können reine HMM-Suchen mit erzwingen --hmonly Möglichkeit. Für mehr
Informationen zu reinen HMM-Suchen finden Sie in der Beschreibung des --hmonly Option unten und
die Bedienungsanleitung.

--max Schalten Sie alle Filter aus und führen Sie „Inside“ ohne Band auf jedem Ziel in voller Länge aus
Reihenfolge. Dies erhöht die Empfindlichkeit etwas, allerdings mit extrem hohen Einbußen bei der Geschwindigkeit.

--nöhm
Schalten Sie alle HMM-Filterstufen (F1 bis F5b) aus. Der CYK-Filter, der QDBs verwendet, wird dies tun
wird auf jeder Zielsequenz voller Länge ausgeführt und erzwingt einen P-Wert-Schwellenwert von
0.0001. Jede Teilsequenz, die CYK überlebt, wird an Inside übergeben, das dies tut
Verwenden Sie auch QDBs (aber einen lockereren Satz). Dies erhöht die Empfindlichkeit etwas, zumindest sehr
große Geschwindigkeitseinbußen.

--Mitte Schalten Sie die HMM-SSV- und Viterbi-Filterstufen (F1 bis F2b) aus. Verbleibendes HMM einstellen
Filterschwellenwerte (F3 bis F5b) sind standardmäßig auf 0.02 eingestellt, können aber geändert werden mit
--Fmid Reihenfolge. Dies kann die Empfindlichkeit erhöhen, allerdings mit erheblichen Geschwindigkeitseinbußen.

--Ursprünglich
Verwenden Sie die Standardfilterstrategie. Diese Option ist standardmäßig aktiviert. Der Filter
Schwellenwerte werden basierend auf der Datenbankgröße bestimmt.

--rfam Verwenden Sie eine strenge Filterstrategie, die für große Datenbanken (mehr als 20 GB) entwickelt wurde. Das
wird die Suche beschleunigen und möglicherweise die Sensibilität beeinträchtigen. Es wird keine haben
Auswirkung, wenn die Datenbank größer als 20 GB ist.

--hmonly
Verwenden Sie für die Suche nur das Filterprofil HMM, nicht das CM. Nur filtern
Die Stufen F1 bis F3 werden unter Verwendung strenger P-Wert-Schwellenwerte (0.02 für) ausgeführt
F1, 0.001 für F2 und 0.00001 für F3). Zusätzlich ist ein Bias-Composition-Filter vorhanden
Wird nach dem F1-Stadium verwendet (mit einer Überlebensschwelle von P = 0.02). Jeder Treffer, der überlebt
alle Stufen und hat einen HMM-E-Wert oder Bit-Score über dem Meldeschwellenwert
ausgegeben werden. Der Benutzer kann die Schwellenwerte und Optionen des Nur-HMM-Filters mit ändern
--hmmF1, --hmmF2, --hmmF3, --hmmnobias, --hmmnonull2, und --hmmmax. Standardmäßig
Suchen nach Modellen mit null Basenpaaren werden im Nur-HMM-Modus ausgeführt. Das kann
deaktiviert werden, wodurch CM gezwungen wird, mit dem nach diesen Modellen zu suchen --nohmmonly .
Diese Optionen werden nur angezeigt, wenn die --devhelp Option verwendet wird.

--FZ
Legen Sie Filterschwellenwerte als Standardwerte fest, wenn die Datenbank verwendet würde Megabasen (Mb).
Bei Verwendung mit größer als 20000 (20 GB) hat diese Option die gleiche Wirkung wie
--rfam.

--Fmid
Mit der --Mitte Mit dieser Option legen Sie die HMM-Filterschwellenwerte (F3 bis F5b) fest . By
Standard ist 0.02.

anderes OPTIONAL


--notrunc
Deaktivieren Sie die Erkennung abgeschnittener Treffer.

--anytrunc
Erlauben Sie abgeschnittenen Treffern, an jeder Position in einer Zielsequenz zu beginnen und zu enden. Von
Standardmäßig müssen 5'-abgeschnittene Treffer den ersten Rest ihrer Zielsequenz enthalten
und 3'-abgeschnittene Treffer müssen den letzten Rest ihrer Zielsequenz enthalten. Mit
Bei dieser Option beobachten Sie möglicherweise weniger Hits in voller Länge, die bis zum Anfang reichen
Ende der Abfrage CM.

--nonull3
Deaktivieren Sie die Null3-CM-Score-Korrekturen für voreingenommene Kompositionen. Diese Korrektur ist
wird während der HMM-Filterstufen nicht verwendet.

--mxsize
Stellen Sie die maximal zulässige CM DP-Matrixgröße auf ein Megabyte. Standardmäßig diese Größe
ist 128 MB. Dies sollte für die überwiegende Mehrheit der Suchanfragen groß genug sein.
vor allem bei kleineren Modellen. Wenn cmsuche stößt auf einen Umschlag im CYK oder
Innerhalb einer Phase, die eine größere Matrix erfordert, wird der Umschlag abgezogen
Rücksichtnahme. Dieses Verhalten ist wie ein zusätzlicher Filter, der teure Schäden verhindert
(langsame) CM DP-Berechnungen, jedoch mit potenziellen Einbußen bei der Empfindlichkeit. Beachten Sie, dass wenn
cmsuche wird eingefahren mehrere Threads auf einer Multicore-Maschine dann jeweils
Thread kann eine zugewiesene Matrix von bis zu Größe haben MB zu einem bestimmten Zeitpunkt.

--smxsize
Legen Sie die maximal zulässige CM-Such-DP-Matrixgröße auf fest Megabyte. Standardmäßig
diese Größe beträgt 128 MB. Diese Option ist nur relevant, wenn der CM kein HMM verwendet
gebänderte Matrizen, d. h. wenn die --max, --nöhm, --qdb, --fqdb, --nicht gebändert, or
--fnonbanded Es werden auch Optionen verwendet. Beachten Sie, dass wenn cmsuche wird eingefahren
Mehrere Threads auf einem Multicore-Computer, dann kann jedem Thread ein zugewiesener Thread zugewiesen werden
Matrix von bis zu Größe MB zu einem bestimmten Zeitpunkt.

--cyk Verwenden Sie den CYK-Algorithmus und nicht Inside, um das Endergebnis aller Treffer zu bestimmen.

--acyk Verwenden Sie den CYK-Algorithmus, um Treffer auszurichten. Standardmäßig ist die optimale Genauigkeit von Durbin/Holmes
Es wird ein Algorithmus verwendet, der die Ausrichtung findet, die die erwartete Genauigkeit maximiert
aller ausgerichteten Reste.

--wcx
Stellen Sie für jeden CM den W-Parameter, die erwartete maximale Länge eines Treffers, auf ein
mal die Konsenslänge des Modells. Standardmäßig wird der W-Parameter gelesen
Die CM-Datei wurde auf Grundlage der Übergangswahrscheinlichkeiten des Modells berechnet
by cmbuild. Mit können Sie herausfinden, wie hoch das Standard-W für ein Modell ist cmstat. Dieser
Die Option sollte mit Vorsicht verwendet werden, da sie sich an mehreren Stellen auf die Filterpipeline auswirkt
verschiedene Stadien auf nicht offensichtliche Weise. Es wird nur erfahrenen Benutzern empfohlen
Suche nach Treffern, die viel länger sind als alle Homologen, die zum Erstellen des verwendet wurden
Modell in cmbuild, zB solche mit großen Introns oder anderen großen Insertionen. Das
Die Option kann nicht in Kombination mit verwendet werden --nöhm, --fqdb or --qdb Optionen
denn in diesen Fällen ist W durch abfrageabhängige Bänder begrenzt.

--nur oben
Durchsuchen Sie nur den obersten (Watson-)Strang der Zielsequenzen . Standardmäßig
beide Stränge werden durchsucht. Dadurch wird die Datenbankgröße (Z) halbiert.

--nur unten
Durchsuchen Sie nur den unteren (Crick-)Strang der Zielsequenzen . Standardmäßig
beide Stränge werden durchsucht. Dadurch wird die Datenbankgröße (Z) halbiert.

--tformat
Stellen Sie sicher, dass die Zielsequenz-Datenbankdatei das richtige Format hat . Akzeptierte Formate
das Fasta, Emblem, Genbank, ddbj, Stockholm, pfam, ein2m, afa, clustal, und Phylip
Standardmäßig wird das Format der Datei automatisch erkannt.

--Zentralprozessor
Setzen Sie die Anzahl der parallelen Worker-Threads auf . Standardmäßig legt Infernal dies fest
auf die Anzahl der CPU-Kerne, die es in Ihrem Computer erkennt – das heißt, es versucht es
Maximieren Sie die Nutzung Ihrer verfügbaren Prozessorkerne. Einstellung höher als die
Die Anzahl der verfügbaren Kerne ist von geringem oder gar keinem Wert, Sie können sie jedoch auf festlegen
etwas weniger. Sie können diese Zahl auch steuern, indem Sie eine Umgebung festlegen
variabel, INFERNAL_NCPU. Diese Option ist nur verfügbar, wenn Infernal kompiliert wurde
mit POSIX-Thread-Unterstützung. Dies ist die Standardeinstellung, wurde jedoch möglicherweise um deaktiviert
aus irgendeinem Grund die Kompilierungszeit für Ihre Site oder Ihren Computer beeinträchtigt.

--Stall
Zum Debuggen der MPI-Master/Worker-Version: Pause nach Start, um die
Entwickler, um Debugger an die laufenden Master- und Worker-Prozesse anzuhängen. Senden
SIGCONT-Signal zum Auslösen der Pause. (Unter gdb: (GDB) Signal SIGCONT) (Nur
verfügbar, wenn die optionale MPI-Unterstützung zur Kompilierzeit aktiviert wurde.)

--mpi Im MPI-Master/Worker-Modus ausführen, mit mpirun. So verwenden Sie --mpi, Die Sequenzdatei muss
wurden zunächst mit dem „indiziert“. esl-sfetch Programm, das im Lieferumfang enthalten ist
Infernal, im Staffelei/Miniapps/ Unterverzeichnis. (Nur verfügbar, wenn optionales MPI
Unterstützung wurde zur Kompilierzeit aktiviert.)

Verwenden Sie cmsearch online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad