Dies ist der Befehl hhblits, der im kostenlosen OnWorks-Hosting-Provider über eine unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
hhblits - schnelle Homologie-Erkennungsmethode zum iterativen Durchsuchen einer HMM-Datenbank
ZUSAMMENFASSUNG
hhblits -i query [Optionen]
BESCHREIBUNG
HHblits Version 2.0.16 (Januar 2013): HMM-HMM-basierte blitzschnelle iterative Sequenz
search HHblits ist ein sensibles, universelles, iteratives Sequenzsuchwerkzeug, das
repräsentiert sowohl Abfrage- als auch Datenbanksequenzen durch HMMs. Sie können HHblits-Datenbanken durchsuchen
beginnend mit einer einzelnen Abfragesequenz, einem Multiple Sequence Alignment (MSA) oder einem HMM.
HHblits druckt eine Rangliste von Datenbank-HMMs/MSAs aus und kann auch ein MSA generieren durch
Zusammenführen der signifikanten Datenbank-HMMs/MSAs auf die Abfrage-MSA.
Remmert M., Biegert A., Hauser A. und Soding J. HHblits: Blitzschnell iterativ
Proteinsequenzsuche durch HMM-HMM-Alignment. Nat. Methoden 9:173-175 (2011) (C)
Johannes Söding, Michael Remmert, Andreas Biegert, Andreas Hauser
-i
Eingabe/Abfrage: Single Sequence oder Multiple Sequence Alignment (MSA) in a3m, a2m oder
FASTA-Format oder HMM im hhm-Format
kann durchweg 'stdin' oder 'stdout' sein.
OPTIONAL
-d
Datenbankname (zB uniprot20_29Feb2012) (default=)
-n [1,8] Anzahl der Iterationen (Standard=2)
-e [0,1] E-Wert-Grenzwert für die Einbeziehung in die Ergebnisausrichtung (def=0.001)
Eingang Ausrichtung Format:
-M a2m A2M/A3M verwenden (Standard): Großbuchstaben = Übereinstimmung; Kleinbuchstaben = Einfügen;
'-' = Löschen; '.' = Lücken auf Einlagen ausgerichtet (kann weggelassen werden)
-M zuerst
Verwenden Sie FASTA: Spalten mit Resten in der 1. Sequenz sind Übereinstimmungszustände
-M [0,100]
FASTA verwenden: Spalten mit weniger als X % Lücken sind Übereinstimmungsstatus
Ausgang Optionen:
-o
Ergebnisse im Standardformat in Datei schreiben (default= )
-oa3m
Ergebnis MSA mit signifikanten Übereinstimmungen im a3m-Format schreiben
-opsi
Ergebnis-MSA von signifikanten Übereinstimmungen im PSI-BLAST-Format schreiben
-ohhm
HHM-Datei für Ergebnis-MSA von signifikanten Übereinstimmungen schreiben
-oalis
MSAs im A3M-Format nach jeder Iteration schreiben
-Ofas
schreiben paarweise Alignments signifikanter Übereinstimmungen im FASTA-Format Analog für
Ausgabe im a3m- und a2m-Format (zB -Oa3m)
-qhm
Anfrageeingabe-HHM-Datei der letzten Iteration schreiben (Standard=aus)
-seq
max. Anzahl der angezeigten Abfrage-/Vorlagensequenzen (Standard=1)
-aliw
Anzahl der Spalten pro Zeile in der Ausrichtungsliste (Standard=80)
-p [0,100]
minimale Wahrscheinlichkeit in Zusammenfassung und Alignment-Liste (Standard=20)
-E [0,inf[
maximaler E-Wert in Zusammenfassung und Alignment-Liste (Standard=1E+06)
-Z
maximale Zeilenanzahl in der zusammenfassenden Trefferliste (Standard=500)
-z
Mindestanzahl von Zeilen in der zusammenfassenden Trefferliste (Standard=10)
-B
maximale Anzahl von Ausrichtungen in der Ausrichtungsliste (Standard = 500)
-b
Mindestanzahl von Ausrichtungen in der Ausrichtungsliste (Standard = 10)
Vorfilteroptionen
-kein Vorfilter
alle Filterschritte deaktivieren
-noaddfilter
alle Filterschritte deaktivieren (außer schnelle Vorfilterung)
-nodbfilter
zusätzliche Filterung vorgefilterter HMMs deaktivieren
-kein Blockfilter Suche komplette Matrix in Viterbi
-maxfilt
maximale Anzahl von Treffern, die den zweiten Vorfilter passieren dürfen (Standard = 2)
Filteroptionen, die auf Abfrage-MSA, Datenbank-MSAs und Ergebnis-MSA angewendet werden
-alles alle Sequenzen im Ergebnis MSA anzeigen; Ergebnis nicht filtern MSA
-id [0,100] maximale paarweise Sequenzidentität (def=90)
-Diff [0,inf[
Filtern Sie MSAs, indem Sie die unterschiedlichsten Sequenzen auswählen und mindestens so viele beibehalten
seqs in jedem MSA-Block der Länge 50 (def=1000)
-cov [0,100] minimale Abdeckung mit Mastersequenz (%) (def=0)
-qid [0,100] minimale Sequenzidentität mit Mastersequenz (%) (def=0)
-qsc [0,100] Mindestpunktzahl pro Spalte mit Mastersequenz (Standard=-20.0)
-neff [1,inf]
Zieldiversität des multiplen Sequenz-Alignments (Standard=aus)
HMM-HMM Ausrichtung Optionen:
-norealign
die angezeigten Treffer NICHT mit dem MAC-Algorithmus neu ausrichten (def=realign)
-makt [0,1[
Posterior-Wahrscheinlichkeitsschwelle für MAC-Neuausrichtung (def=0.350) Parameterkontrollen
Ausrichtungsgier: 0:global >0.1:lokal
-globus/-loc
Verwenden Sie den globalen/lokalen Ausrichtungsmodus für die Suche/das Ranking (def=local)
-neu ausrichten_max
neu ausrichten max. Treffer (Standard = 1000)
-untere
Zeigen Sie bis zu diesen vielen signifikanten alternativen Ausrichtungen an (def=2)
-vorverschmelzen verschmelzen Treffer, um MSA abzufragen, bevor die verbleibenden Treffer ausgerichtet werden (def=3)
-Verschiebung [-1,1]
Profil-Profil-Score-Offset (def=-0.03)
-ssm {0,..,4}
0: keine ss-Bewertung 1,2: ss-Bewertung nach oder während der Ausrichtung [default=2] 3,4: ss
Scoring nach oder während der Ausrichtung, vorhergesagt vs. vorhergesagt
-sw [0,1]
Gewicht des SS-Scores (def=0.11)
Lücke kosten Optionen:
-Lücke [0,inf[
Übergangs-Pseudozähler-Beimischung (def=1.00)
-Lücke [0,inf[
Übergangs-Pseudozähler-Beimischung für offene Lücke (Standard = 0.15)
-klaffen [0,1.5]
Übergangs-Pseudozähler-Beimischung für Lücke erweitern (def=1.00)
-lücke ]0,inf]
Faktor zum Erhöhen/Reduzieren der Lückenöffnungsstrafe für Löschungen (def=0.60)
-lücke ]0,inf]
Faktor zum Erhöhen/Reduzieren der Lückenöffnungsstrafe für Einfügungen (def=0.60)
-lücke ]0,inf]
Faktor zum Erhöhen/Reduzieren der Lückenerweiterungsstrafe für Löschungen (def=0.60)
-gapi ]0,inf]
Faktor zum Erhöhen/Reduzieren der Lückenerweiterungsstrafe für Einfügungen (def=0.60)
-egq [0,inf[ Strafe (Bits) für Endlücken, die auf Abfragereste ausgerichtet sind (def=0.00)
-egt [0,inf[ Strafe (Bits) für Endlücken, die an Vorlagenresten ausgerichtet sind (def=0.00)
Pseudoanzahl (Stück) Optionen:
-pcm {0,..,2}
Positionsabhängigkeit der PC-Beimischung 'tau' (PC-Modus, Standard=2) 0: keine Pseudozählungen:
tau = 0 1: konstant tau = a 2: diversitätsabhängig: tau = a/(1 +
((Neff[i]-1)/b)^c) (Neff[i]: Anzahl der effektiven Sequenzen im lokalen MSA um Spalte i)
-PCA [0,1] Gesamt-Pseudozahl-Beimischung (def=1.0)
-Leiterplatte [1,inf[ Neff-Schwellenwert für -pcm 2 (Def=1.5)
-pcc [0,3] Exponentialexponent c für -pcm 2 (Def=1.0)
-pre_pca [0,1]
PREFILTER Pseudocount-Beimischung (def=0.8)
-pre_pcb [1,inf[ PREFILTER-Schwellenwert für Neff (def=1.8)
Kontextspezifisch Pseudozahlen:
-nocontxt
Substitutionsmatrix anstelle kontextspezifischer Pseudozählungen verwenden
-Kontext Kontextdatei zum Berechnen kontextspezifischer Pseudozahlen
(Standard=./data/context_data.lib)
-cslib
Spaltenstatusdatei für schnelle Datenbankvorfilterung (default=./data/cs219.lib)
Sekundärstruktur vorhersagen
-adss Addieren Sie die mit PSIPRED vorhergesagte zweite Struktur zum Ergebnis MSA
-psipred Verzeichnis mit ausführbaren PSIPRED-Dateien (Standard =)
-psipred_data
Verzeichnis mit PSIPRED-Daten (default=)
Andere Optionen:
-v
ausführlicher Modus: 0:keine Bildschirmausgabe 1:nur Warnungen 2: ausführlich (def=2)
-neffmax ]1,20] weitere Suchiterationen überspringen, wenn Diversity Neff der Abfrage MSA
wird größer als neffmax (Standard = 10.0)
-Zentralprozessor
Anzahl der zu verwendenden CPUs (für Shared Memory SMPs) (Standard=2)
-Scores schreibe Ergebnisse für alle paarweisen Vergleiche in die Datei
-atab schreibe alle Ausrichtungen im tabellarischen Layout in eine Datei
-maxres
maximale Anzahl von HMM-Spalten (def=15002)
-maxim [1,inf[ max. verfügbarer Speicher in GB (def=3.0)
Beispiele:
hhblits -i query.fas -o query.hhr -d ./uniprot20
hhblits -i query.fas -o query.hhr -oa3m query.a3m -n 1 -d ./uniprot20
Datenbanken herunterladen vonftp://toolkit.genzentrum.lmu.de/pub/HH-suite/databases/>.
Verwenden Sie hhblits online mit den onworks.net-Diensten