Aceasta este comanda hhsearch care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
hhsearch - căutați o bază de date de HMM-uri cu o aliniere a interogării sau interogați HMM
REZUMAT
hhsearch -i întrebare -d Baza de date [Opțiuni]
DESCRIERE
HHsearch versiunea 2.0.16 (ianuarie 2013) Căutați într-o bază de date de HMM-uri cu o aliniere a interogării sau
interogare HMM (C) Johannes Soeding, Michael Remmert, Andreas Biegert, Andreas Hauser Soding,
J. Detectarea omologiei proteinelor prin comparație HMM-HMM. Bioinformatics 21:951-960 (2005).
-i
introduceți/interogați alinierea secvenței multiple (a2m, a3m, FASTA) sau HMM
-d
Baza de date HMM cu HMM-uri concatenate în format hhm, HMMER sau a3m, SAU, dacă fișierul are
extensia prieten, listă de nume de fișiere HMM, una pe linie. Mai multe dbs, HMM-uri sau pal
fișiere cu -d ' ...'
poate fi „stdin” sau „stdout” peste tot.
producție opţiuni:
-o
scrieți rezultatele în format standard în fișier (implicit= )
-Ofas
scrieți aliniamente perechi ale potrivirilor semnificative în format FASTA Analog pentru
ieșire în format a3m, a2m și psi (de ex -Oa3m)
-oa3m
scrieți MSA de potriviri semnificative în format a3m Analog pentru ieșire în a2m, psi,
și formatul hhm (de ex -ohhm)
-e [0,1]
Limită de valoare E pentru includerea în aliniere multiplă (def=0.001)
-seq
max. numărul de secvențe de interogări/șabloane afișate (def=1) Atenție la depășiri! Toate
aceste secvențe sunt stocate în memorie.
-contra arată secvența consens ca secvență principală a interogării MSA
-nocons
nu afișează secvența consensului în alinieri (implicit=arată)
-nopred
nu afișează structura secundară prezisă în aliniamente (implicit=arată)
-nodssp
nu afișează structura DSSP 2ndary în aliniamente (implicit=arată)
-ssconf
arătați confidențe pentru structura secundară prezisă în aliniamente
-p
probabilitate minimă în rezumatul și lista de aliniere (def=20)
-E
valoarea E maximă în rezumatul și lista de aliniere (def=1E+06)
-Z
numărul maxim de rânduri în lista rezumată a rezultatelor (def=500)
-z
numărul minim de rânduri în lista rezumată a rezultatelor (def=10)
-B
numărul maxim de aliniamente în lista de alinieri (def=500)
-b
numărul minim de aliniamente în lista de alinieri (def=10)
-aliw [40,..[
numărul de coloane pe linie din lista de aliniere (def=80)
-dbstrlen
lungimea maximă a șirului bazei de date care urmează să fie tipărită în fișierul hhr
Interogarea filtrului alinierea secvenței multiple
-id [0,100] identitate maximă de secvență perechi (%) (def=90)
-dif [0,inf[
filtrați MSA selectând cele mai diverse seturi de secvențe, păstrând cel puțin atâtea
secvențe în fiecare bloc MSA de lungime 50 (def=100)
-cov [0,100] acoperire minimă cu interogare (%) (def=0)
-qid [0,100] identitate de secvență minimă cu interogare (%) (def=0)
-qsc [0,100] scor minim pe coloană cu interogare (def=-20.0)
-neff [1,inf]
diversitatea țintă de aliniere (implicit=dezactivată)
Intrare aliniere format:
-M a2m folosește A2M/A3M (implicit): majuscule = Potrivire; minuscule = Inserare; '-' = Șterge; '.' =
goluri aliniate la inserții (pot fi omise)
-M primul
utilizați FASTA: coloanele cu reziduuri în prima secvență sunt stări de potrivire
-M [0,100]
utilizați FASTA: coloanele cu mai puțin de X% lacune sunt stări de potrivire
-Etichete NU neutralizați etichetele His-, C-myc-, FLAG și secvența de recunoaștere a tripsinei pentru
distribuția de fundal
HMM-HMM aliniere opţiuni:
-norealign
NU realiniați hit-urile afișate cu algoritmul MAC (def=realiniere)
-Mact [0,1[
prag de probabilitate posterior pentru realinierea MAC (def=0.350) Controale parametrilor
lăcomie de aliniere: 0:global >0.1:local
-glob/-loc
utilizați modul de aliniere global/local pentru căutare/clasare (def=local)
-alt
să apară la aceste multe alinieri alternative semnificative (def=2)
-vit utilizați algoritmul Viterbi pentru căutare/clasare (implicit)
-Mac utilizați algoritmul Maximum Accuracy (MAC) pentru căutare/clasare
-redirecţiona
utilizați probabilitatea înainte pentru căutare
-excl
excludeți pozițiile de interogare din aliniere, de exemplu, „1-33,97-168”
-schimb [-1,1]
compensarea scorului (def=-0.03)
-corr [0,1]
ponderea termenului pentru corelațiile de pereche (def=0.10)
-sc scorul de aminoacizi (tja: șablon HMM la coloana j) (def=1)
0 = log2 Sum(tja*qia/pa) (pa: frecvențe de fundal aa)
1 = log2 Suma(tja*qia/pqa) (pqa = 1/2*(pa+ta) )
2 = log2 Sum(tja*qia/ta) (ta: frecvențe av. aa în șablon)
3 = log2 Sum(tja*qia/qa) (qa: frecvențe av. aa în interogare)
5 corecție locală a compoziției aminoacizilor
-ssm {0,...,4}
0: fără scor ss 1,2: scor ss după sau în timpul alinierii [implicit=2] 3,4: ss
punctaj după sau în timpul alinierii, prezis vs. prezis
-ssw [0,1] ponderea scorului ss comparativ cu scorul coloanei (def=0.11)
-ssa [0,1] Matrice de substituție SS = (1-ssa)*I + ssa*matrice-de-substituție-full-SS
[def=1.00)
Decalaj costa opţiuni:
-gapb [0,inf[
Amestec de pseudonumăr de tranziție (def=1.00)
-gapd [0,inf[
Combinație de pseudonumăr de tranziție pentru decalaj deschis (implicit=0.15)
-gape [0,1.5]
Amestec de pseudonumăr de tranziție pentru decalajul extins (def=1.00)
-gapf ]0,inf]
factor de creștere/reducere a penalității de deschidere a decalajului pentru ștergere (def=0.60)
-gapg ]0,inf]
factor de creștere/reducere a penalizării de deschidere a gap-ului pentru inserții (def=0.60)
-gaf ]0,inf]
factor de creștere/reducere a decalajului extinde penalitatea pentru ștergeri (def=0.60)
-gapi ]0,inf]
factor de creștere/reducere a decalajului extinde penalizare pentru inserții (def=0.60)
-exq [0,inf[ penalizare (biți) pentru golurile de capăt aliniate la reziduurile de interogare (def=0.00)
-egt [0,inf[ penalizare (biți) pentru golurile de capăt aliniate la reziduurile șablonului (def=0.00)
Pseudoconte (buc) opţiuni:
-pcm {0,...,3}
dependența de poziție a amestecului de computer „tau” (modul computer, implicit = 2) 0: nu se numără pseudo:
tau = 0 1: constant tau = a 2: dependent de diversitate: tau = a/(1 +
((Neff[i]-1)/b)^c) (Neff[i]: numărul de secvențe efective în MSA local în jurul coloanei i)
3: pseudonumărări constante de diversitate
-pca [0,1] amestec de pseudonumăr total (def=1.0)
-pcb [1,inf[ Valoarea pragului Neff pentru -pcm 2 (def=1.5)
-pcc [0,3] extincție exponent c pentru -pcm 2 (def=1.0)
Specific contextului pseudo-numărări:
-nocontxt
utilizați matrice de substituție în loc de pseudonumărări specifice contextului
-contxt fișier de context pentru calcularea pseudonumărărilor specifice contextului
(implicit=./data/context_data.lib)
-cslib
fișier de stare a coloanei pentru prefiltrarea rapidă a bazei de date (implicit=./data/cs219.lib)
-csw [0,inf] greutatea poziției centrale în modul pseudocount cs (def=1.6)
-csb [0,1] parametru de scădere a greutății pentru poziții în modul cs pc (def=0.9)
Altele opţiuni:
-CPU
numărul de procesoare de utilizat (pentru SMP-uri cu memorie partajată) (implicit=1)
-v
mod verbos: 0: fără ieșire pe ecran 1: doar avertismente 2: verbos
-maxres
numărul maxim de coloane HMM (def=15002)
-maxmem [1,inf[ memorie maximă disponibilă în GB (def=3.0)
-scoruri scrieți scorurile pentru toate comparațiile pe perechi în fișier
-calm {0,...,3} calibrare empirică a scorului 0:interogare 1:șablon 2:ambele
implicit 3: estimarea bazată pe rețea neuronală a parametrilor EVD
Exemplu: hhsearch -i a.1.1.1.a3m -d scop70_1.71.hhm
Utilizați hhsearch online folosind serviciile onworks.net