EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

jackhmmer - Online în cloud

Rulați jackhmmer în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Acesta este jackhmmer de comandă care poate fi rulat în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


jackhmmer - caută iterativ secvența(e) într-o bază de date de proteine

REZUMAT


jackhmmer [Opțiuni]

DESCRIERE


jackhmmer caută iterativ fiecare secvență de interogare în împotriva țintei
secvență(e) în . Prima iterație este identică cu a phmmer căutare. Pentru
următoarea iterație, o aliniere multiplă a interogării împreună cu toate secvențele țintă
satisfăcător includere praguri este asamblat, se construiește un profil din acest aliniament
(identic cu utilizarea hmmbuild pe aliniament) și căutarea de profil a este gata
(identic cu un hmm căutare cu profilul).

Interogarea poate fi „-” (un caracter liniuță), caz în care secvențele de interogare sunt
citeste din a pipe în loc de dintr-un fișier. The nu poate fi citit din a
stream, pentru că jackhmmer trebuie să facă mai multe treceri peste baza de date.

Formatul de ieșire este conceput pentru a fi citit de om, dar este adesea atât de voluminos încât
citirea lui este nepractică, iar analizarea lui este o durere. The --tblout și --domtblout Opțiuni
salvați rezultatul în formate tabelare simple, care sunt concise și mai ușor de analizat. The -o opțiune
permite redirecționarea ieșirii principale, inclusiv aruncarea acesteia în /dev/null.

OPŢIUNI


-h Ajutor; imprimați un scurt memento cu privire la utilizarea liniei de comandă și toate opțiunile disponibile.

-N Setați numărul maxim de iterații la . Valoarea implicită este 5. Dacă N=1, rezultatul
este echivalentă cu o phmmer căutare.

OPŢIUNI CONTROLUL REZULTATE


În mod implicit, ieșirea pentru fiecare iterație apare pe stdout într-un mod oarecum lizibil de om,
format oarecum analizabil. Aceste opțiuni permit redirecționarea acelei rezultate sau salvarea
tipuri suplimentare de ieșire la fișiere, inclusiv fișiere punct de control pentru fiecare iterație.

-o Direcționați rezultatul care poate fi citit de om către un fișier .

-A După ultima iterație, salvați o aliniere multiplă adnotată a tuturor accesărilor
satisfacerea pragurilor de includere (inclusiv interogarea inițială) la in
Formatul Stockholm.

--tblout
După ultima iterație, salvați un rezumat tabelar al accesărilor din secvența de sus într-un
format ușor analizabil, în coloană, delimitat de spații albe.

--domtblout
După ultima iterație, salvați un rezumat tabelar al principalelor accesări ale domeniului într-un
format ușor analizabil, în coloană, delimitat de spații albe.

--chkhmm
La începutul fiecărei iterații, verificați interogarea HMM, salvând-o într-un fișier numit
- .hmm Unde este numărul iterației (de la 1..N).

--chkali
La sfârșitul fiecărei iterații, verificați o aliniere a tuturor domeniilor satisfăcătoare
praguri de includere (de exemplu, ce va deveni interogarea HMM pentru următoarea iterație),
salvând-o într-un fișier numit <punct de control fişier prefix>- .sto în format Stockholm,
Unde este numărul iterației (de la 1..N).

--acc Utilizați accesări în loc de nume în rezultatul principal, acolo unde este disponibil pentru profiluri
și/sau secvențe.

--noali
Omiteți secțiunea de aliniere din ieșirea principală. Acest lucru poate reduce foarte mult producția
volum.

--notextw
Nelimitați lungimea fiecărei linii din ieșirea principală. Valoarea implicită este o limită de 120
caractere pe linie, ceea ce ajută la afișarea curată a rezultatelor pe terminale și
în editori, dar poate trunchia liniile de descriere a profilului țintă.

--textw
Setați limita de lungime a liniei de ieșire principală la caractere pe linie. Valoarea implicită este
120.

OPŢIUNI CONTROLUL SINGLE SECVENŢĂ PUNTAREA (PRIMUL REPETARE)


În mod implicit, prima iterație folosește un model de căutare construit dintr-o singură interogare
secvenţă. Acest model este construit folosind o matrice de substituție standard de 20x20 pentru reziduu
probabilități și doi parametri suplimentari pentru deschiderea și decalajul independent de poziție
extinde probabilitățile. Aceste opțiuni permit parametrii impliciti de punctare dintr-o singură secvență
a fi schimbat.

--deschide
Setați probabilitatea de deschidere a decalajului pentru un model de interogare cu o singură secvență la . Implicit
este 0.02. trebuie să fie >= 0 și < 0.5.

--pextend
Setați probabilitatea extinderii decalajului pentru un model de interogare cu o singură secvență la .
implicit este 0.4. trebuie să fie >= 0 și < 1.0.

--mx
Obține probabilitățile de aliniere a reziduurilor din matricea de substituție încorporată numită
. Mai multe matrice standard sunt încorporate și nu trebuie să fie citite din
fișiere. Numele matricei poate fi PAM30, PAM70, PAM120, PAM240, BLOSUM45,
BLOSUM50, BLOSUM62, BLOSUM80 sau BLOSUM90. Doar unul dintre --mx și --mxfile
pot fi utilizate opțiuni.

--mxfile
Obține probabilitățile de aliniere a reziduurilor din matricea de substituție din fișier
. Matricea de scor implicită este BLOSUM62 (această matrice este internă pentru HMMER
și nu trebuie să fie disponibil ca fișier). Formatul unei matrice de substituție
este formatul standard acceptat de BLAST, FASTA și alte secvențe
software de analiză.

OPŢIUNI CONTROLUL RAPORTAREA PRAȘE


Pragurile de raportare controlează ce accesări sunt raportate în fișierele de ieșire (ieșirea principală,
--tblout, și --domtblout). În fiecare iterație, accesările de secvență și accesările de domeniu sunt clasate
prin semnificație statistică (valoarea E) și producția este generată în două secțiuni numite per-
ieșire țintă și pe domeniu. În ieșirea per-țintă, în mod implicit, toate secvențele accesează cu un
Sunt raportate valori E <= 10. În rezultatul per-domeniu, pentru fiecare țintă care a depășit per-
pragurile de raportare vizate, toate domeniile care satisfac pragurile de raportare pe domeniu sunt
raportat. În mod implicit, acestea sunt domenii cu valori E condiționale <= 10. Următoarele
opțiunile vă permit să modificați pragurile implicite de raportare a valorii E sau să utilizați scorul de biți
praguri în schimb.

-E Secvențele de raportare cu valori E <= în ieșire pe secvență. Valoarea implicită este 10.0.

-T Utilizați un prag de scor de biți pentru ieșirea pe secvență în loc de un prag de valoare E
(orice setare a -E este ignorat). Raportați secvențele cu un scor de biți >= . De
implicit, această opțiune este nesetata.

-Z Declarați dimensiunea totală a bazei de date secvențe, în scopul valorii E
calcul. În mod normal, valorile E sunt calculate în funcție de dimensiunea bazei de date
ați căutat de fapt (de exemplu, numărul de secvențe în target_seqdb). În unele
cazuri (de exemplu, dacă ați împărțit baza de date cu secvențe țintă în mai multe
fișiere pentru paralelizarea căutării dvs.), este posibil să știți mai bine care este dimensiunea reală
din spațiul tău de căutare este.

--dom
Raportați domeniile cu valori E condiționate <= în ieșire pe domeniu, în plus
la domeniul cu cel mai mare punctaj pe secvență semnificativă. Valoarea implicită este 10.0.

--domT
Utilizați un prag de scor de biți pentru ieșirea pe domeniu în loc de un prag de valoare E
(orice setare a --domT este ignorat). Raportați domenii cu un scor de biți >= in
ieșire pe domeniu, în plus față de domeniul cu cel mai mare scor pe secvență semnificativă
lovit. În mod implicit, această opțiune este dezactivată.

--domZ
Declarați numărul de secvențe semnificative care urmează să fie secvențe, în scopuri de
calculul condițional al valorii E pentru o semnificație suplimentară a domeniului. În mod normal
valorile E condiționale sunt calculate în raport cu numărul de secvențe care trec
pragul de raportare pe secvență.

OPŢIUNI CONTROLUL INCLUDERE PRAȘE


Pragurile de includere controlează ce accesări sunt incluse în alinierea și profilul multiplu
construit pentru următoarea iterație de căutare. În mod implicit, o secvență trebuie să aibă o per-
Valoarea E a secvenței <= 0.001 (vezi -E opțiune) pentru a fi incluse și orice domenii suplimentare în
pe lângă cel cu cel mai mare scor, trebuie să aibă o valoare E condiționată de <= 0.001 (vezi --dom
opțiune). Diferența dintre pragurile de raportare și pragurile de includere este aceea că
pragurile de includere controlează care hit-uri sunt folosite efectiv în următoarea iterație (sau
ieșire finală aliniere multiplă dacă -A este utilizată opțiunea), în timp ce pragurile de raportare
controlați ceea ce vedeți în ieșire. Pragurile de raportare sunt în general mai laxe, așa că puteți
vezi lovituri limită în partea de sus a zgomotului care ar putea fi de interes.

--incE
Includeți secvențe cu valori E <= în iterația ulterioară sau alinierea finală
ieșire de -A. Valoarea implicită este 0.001.

--incT
Utilizați un prag de scor de biți pentru includerea pe secvență în loc de o valoare E
prag (orice setare de --incE este ignorat). Includeți secvențe cu un scor de biți de
>= . În mod implicit, această opțiune este dezactivată.

--incdomE
Includeți domenii cu valori E condiționate <= în iterație ulterioară sau finală
iesire aliniere de catre -A, pe lângă domeniul cu cel mai mare punctaj per semnificativ
lovitură de secvență. Valoarea implicită este 0.001.

--incdomT
Utilizați un prag de scor de biți pentru includerea pe domeniu în loc de un prag de valoare E
(orice setare a --incT este ignorat). Includeți domenii cu un scor de biți >= . De
implicit, această opțiune este nesetata.

OPŢIUNI CONTROLUL ACCELERARE EURISTICA


Căutările HMMER3 sunt accelerate într-o conductă de filtru în trei pași: filtrul MSV, filtrul
filtrul Viterbi și filtrul Forward. Primul filtru este cel mai rapid și cel mai
aproximativ; ultimul este algoritmul complet de scor Forward, cel mai lent, dar cel mai precis.
Există, de asemenea, o etapă de filtru de polarizare între MSV și Viterbi. Ținte care trec toți pașii
în conducta de accelerare sunt apoi supuse postprocesării -- identificarea domeniului
și notarea utilizând algoritmul Înainte/Înapoi.

În esență, singurii parametri liberi care controlează filtrele euristice ale HMMER sunt P-
praguri de valoare care controlează fracțiunea așteptată de secvențe neomologe care trec
filtrele. Setarea pragurilor implicite mai mari va trece o proporție mai mare de
secvență neomoloagă, creșterea sensibilității în detrimentul vitezei; invers,
setarea unor praguri mai mici ale valorii P va depăși o proporție mai mică, scăzând sensibilitatea
și creșterea vitezei. Setarea pragului de valoare P al unui filtru la 1.0 înseamnă că va trece
toate secvențele și dezactivează efectiv filtrul.

Modificarea pragurilor de filtrare numai elimină sau include ținte din considerare; schimbându-se
pragurile de filtrare nu modifică scorurile de biți, valorile E sau aliniamentele, toate acestea fiind
determinate exclusiv în postprocesare.

--max Sensibilitate maxima. Opriți toate filtrele, inclusiv filtrul de părtinire, și rulați complet
Postprocesare înainte/înapoi pe fiecare țintă. Acest lucru crește sensibilitatea
ușor, cu un cost mare în viteză.

--F1
Primul prag de filtru; setați pragul valorii P pentru pasul de filtru MSV. The
implicit este 0.02, ceea ce înseamnă că aproximativ 2% din cel mai mare scor neomolog
se așteaptă ca obiectivele să treacă de filtru.

--F2
Al doilea prag de filtru; setați pragul valorii P pentru treapta filtrului Viterbi.
Valoarea implicită este 0.001.

--F3
Al treilea prag de filtru; setați pragul valorii P pentru pasul de filtru înainte. The
implicit este 1e-5.

--nobias
Opriți filtrul de polarizare. Acest lucru crește oarecum sensibilitatea, dar poate veni la a
cost ridicat în viteză, mai ales dacă interogarea are o compoziție părtinitoare a reziduurilor (cum ar fi
o regiune de secvență repetitivă sau dacă este o proteină membranară cu regiuni mari de
hidrofobicitate). Fără filtrul de polarizare, prea multe secvențe pot trece prin filtru
cu interogări părtinitoare, ceea ce duce la o performanță mai lentă decât se aștepta, ca
Algoritmii Forward/Backward cu calcul intensiv umăr sunt anormal de grei
încărcați.

OPŢIUNI CONTROLUL PROFIL CONSTRUCTIE (MAI TARZIU ITERATII)


Aceste opțiuni controlează modul în care sunt definite coloanele de consens în mai multe alinieri când
profile de constructii. În mod implicit, jackhmmer include întotdeauna secvența de interogare inițială în
rezultatul alinierii la fiecare iterație, iar pozițiile de consens sunt definite de acea interogare
secvență: adică o implicită jackhmmer profilul are întotdeauna aceeași lungime ca originalul dvs
interogare, la fiecare iterație.

--rapid Definiți coloanele de consens ca fiind cele care au o fracție >= simfrac de reziduuri ca
opus lacune. (Vezi mai jos pentru --simfrac opțiunea.) Deși aceasta este cea implicită
opțiune de construcție a profilului în altă parte (în hmmbuild, în special), poate avea
efecte nedorite în jackhmmer, deoarece un profil ar putea intra în mod iterativ
spațiu de secvență departe de interogarea originală, lăsând puține coloane de consens sau deloc
corespunzătoare reziduurilor sale.

--mână Definiți coloanele de consens în profilul următor folosind adnotarea de referință la multiplu
aliniere. jackhmmer propaga adnotarea de referință din profilul anterior la
alinierea multiplă și apoi la următorul profil. Aceasta este valoarea implicită.

--simfrac
Definiți pragul de fracțiune de reziduu necesar pentru a defini o coloană de consens când
folosind --rapid opțiune. Valoarea implicită este 0.5. Fracția simbol din fiecare coloană este
calculat după luarea în considerare a ponderării secvenței relative și ignorând decalajul
caractere corespunzătoare capetelor fragmentelor de secvență (spre deosebire de cele interne
inserții/ștergeri). Setarea acestui lucru la 0.0 înseamnă că fiecare coloană de aliniere va fi
fi atribuite ca consens, ceea ce poate fi util în unele cazuri. Setându-l la 1.0
înseamnă că numai coloanele care includ 0 goluri (inserții/ștergeri interne) vor fi
atribuite ca consens.

--fragthresh
Vrem să numărăm golurile terminale ca ștergeri numai dacă secvența aliniată este cunoscută
să fie pe lungime, nu dacă este un fragment (de exemplu, pentru că doar o parte din el
a fost secvențial). HMMER folosește o regulă simplă pentru a deduce fragmente: dacă lungimea secvenței
L este mai mic sau egal cu o fracție ori lungimea alinierii în coloane,
apoi secvența este tratată ca un fragment. Valoarea implicită este 0.5. Setare
--fragthresh0 nu va defini nicio secvență (nevide) ca un fragment; poate vrei
fă acest lucru dacă știi că ai o aliniere pe toată lungimea cu grijă
secvente. Setare --fragthresh1 va defini toate secvențele ca fragmente; tu ai putea
vrei să faci asta dacă știi că alinierea ta este compusă în întregime din fragmente, de exemplu
după cum s-au tradus citiri scurte în datele metagenomice ale puștilor.

OPŢIUNI CONTROLUL RELATIV GREUTĂȚI


Ori de câte ori un profil este construit dintr-o aliniere multiplă, HMMER utilizează o secvență ad-hoc
algoritm de ponderare pentru a reduce secvențele strâns înrudite și a crește greutatea la distanță
cele. Acest lucru are efectul de a face modelele mai puțin părtinitoare de filogenetică neuniformă
reprezentare. De exemplu, două secvențe identice ar primi, de obicei, fiecare jumătate din
greutatea pe care o ar avea o secvență (și de aceea jackhmmer nu este preocupat de mereu
inclusiv secvența de interogare inițială în alinierea fiecărei iterații, chiar dacă o găsește
din nou în baza de date pe care o căutați). Aceste opțiuni controlează ce algoritm este utilizat.

--wpb Utilizați schema de ponderare a secvenței bazată pe poziție Henikoff [Henikoff și Henikoff,
J. Mol. Biol. 243:574, 1994]. Aceasta este valoarea implicită.

--wgsc Utilizați algoritmul de ponderare Gerstein/Sonnhammer/Chothia [Gerstein și colab., J. Mol.
Biol. 235:1067, 1994].

--wblosum
Utilizați aceeași schemă de grupare care a fost folosită pentru ponderea datelor în calcularea BLOSUM
matrice de substituție [Henikoff și Henikoff, Proc. Natl. Acad. Sci 89:10915, 1992].
Secvențele sunt grupate cu o singură legătură la un prag de identitate (implicit 0.62; vezi
--lată) și în cadrul fiecărui grup de secvențe c, fiecare secvență capătă greutate relativă
1/c.

--nici unul
Fără greutăți relative. Toate secvențele au o greutate uniformă.

--lată
Setează pragul de identitate utilizat de gruparea cu legături unice atunci când se utilizează --wblosum.
Invalid cu orice altă schemă de ponderare. Implicit este 0.62.

OPŢIUNI CONTROLUL EFECTIV SECVENŢĂ NUMĂR


După ce ponderile relative sunt determinate, acestea sunt normalizate pentru a se însuma la un efectiv total
număr de secvență, eff_nseq. Acest număr poate fi numărul real de secvențe din
aliniament, dar este aproape întotdeauna mai mic decât atât. Ponderea implicită a entropiei
metodă (--eent) reduce numărul efectiv de secvență pentru a reduce conținutul informației
(entropia relativă sau scorul mediu așteptat pe omologi adevărați) pe poziție de consens. The
Entropia relativă țintă este controlată de o funcție cu doi parametri, unde cei doi
parametrii sunt setabili cu --aici și --esigma.

--eent Ajustați numărul de secvență efectiv pentru a obține o anumită entropie relativă per
poziție (vezi --aici). Aceasta este valoarea implicită.

--eclust
Setați numărul de secvență efectiv la numărul de clustere cu o singură legătură la a
pragul de identitate specific (vezi --eid). Această opțiune nu este recomandată; este pentru
experimente care evaluează cât de bine --eent este.

--enone
Dezactivați determinarea efectivă a numărului de secvență și utilizați doar numărul real de
secvente. Un motiv pentru care ați putea dori să faceți acest lucru este să încercați să maximizați ruda
entropia/poziția modelului dvs., care poate fi utilă pentru modele scurte.

--eset
Setați în mod explicit numărul de secvență efectiv pentru toate modelele la .

--aici
Setați ținta minimă de entropie/poziție relativă la . Necesită --eent. Mod implicit
depinde de alfabetul secvenței; pentru secvențele de proteine, este de 0.59 biți/poziție.

--esigma
Setează entropia relativă minimă contribuită de un întreg model de aliniere, peste
întreaga sa lungime. Acest lucru are efectul de a face modelele scurte să aibă relativă mai mare
entropie pe poziție decât --aici singur ar da. Valoarea implicită este 45.0 biți.

--eid
Setează limita de identitate fracțională pe perechi utilizată de gruparea cu o singură legătură
il --eclust opțiune. Valoarea implicită este 0.62.

OPŢIUNI CONTROLUL ANTERIORI


În construcția profilului, în mod implicit, numărările ponderate sunt convertite în medii posterioare
estimări ale parametrilor de probabilitate folosind amestecul de priorități Dirichlet. Amestecul implicit Dirichlet
se construiesc parametri anteriori pentru modelele de proteine ​​si pentru modelele de acid nucleic (ARN si ADN).
in. Următoarele opțiuni vă permit să înlocuiți prioritățile implicite.

--pnone Nu utilizați niciun antecedente. Parametrii de probabilitate vor fi pur și simplu observați
frecvențe, după ponderarea secvenței relative.

--placeplace Utilizați un Laplace +1 înainte în locul amestecului implicit Dirichlet înainte.

OPŢIUNI CONTROLUL E-VALOARE CALIBRARE


Estimarea parametrilor de locație pentru distribuțiile de scor așteptate pentru filtrul MSV
scoruri, scorurile filtru Viterbi și scorurile înainte necesită trei secvențe aleatorii scurte
simulări.

--EmL
Setează lungimea secvenței în simulare care estimează parametrul de locație mu pentru
Valorile E ale filtrului MSV. Implicit este 200.

--EmN
Setează numărul de secvențe din simulare care estimează parametrul de locație mu
pentru valorile E ale filtrului MSV. Implicit este 200.

--EvL
Setează lungimea secvenței în simulare care estimează parametrul de locație mu pentru
Valorile E ale filtrului Viterbi. Implicit este 200.

--EvN
Setează numărul de secvențe din simulare care estimează parametrul de locație mu
pentru valorile E ale filtrului Viterbi. Implicit este 200.

--EfL
Setează lungimea secvenței în simulare care estimează parametrul de locație tau
pentru Forward E-value. Implicit este 100.

--EfN
Setează numărul de secvențe din simulare care estimează parametrul locației
tau pentru Forward E-value. Implicit este 200.

--Eft
Setează fracția de masă a cozii pentru a se potrivi în simularea care estimează locația
parametrul tau pentru evaluările Forward. Implicit este 0.04.

ALTE OPŢIUNI


--nonull2
Dezactivați corecțiile scorului null2 pentru compoziția părtinitoare.

-Z Afirmați că numărul total de ținte din căutările dvs. este , în scopurile
de calcule de valoare E pe secvență, mai degrabă decât numărul real de ținte
văzut.

--domZ
Afirmați că numărul total de ținte din căutările dvs. este , în scopurile
de calcule de valoare E condiționată pe domeniu, mai degrabă decât numărul de ținte
care au depășit pragurile de raportare.

--samanta
Seed generatorul de numere aleatorii cu , un întreg >= 0. Dacă este >0, oricare
simulările stocastice vor fi reproductibile; aceeași comandă va da același
rezultate. Dacă este 0, generatorul de numere aleatoare este însămânțat în mod arbitrar și
simulările stocastice vor varia de la o rulare la alta a aceleiași comenzi. Implicit
sămânța este 42.

--qformat
Declarați că intrarea query_seqfile este în format . Fișier de secvență acceptat
formatele includ FASTA, EMBL, GenBank, DDBJ, UniProt, Stockholm și SELEX. Mod implicit
este de a detecta automat formatul fișierului.

--tformat
Declarați că intrarea target_seqdb este în format . Fișier de secvență acceptat
formatele includ FASTA, EMBL, GenBank, DDBJ, UniProt, Stockholm și SELEX. Mod implicit
este de a detecta automat formatul fișierului.

--CPU
Setați numărul de fire de lucru paralele la . În mod implicit, HMMER setează acest lucru la
numărul de nuclee CPU pe care le detectează în mașina dvs. - adică încearcă să maximizeze
utilizarea nucleelor ​​de procesor disponibile. Setare mai mare decât numărul de
nucleele disponibile are o valoare mică sau deloc, dar poate doriți să le setați la ceva
Mai puțin. De asemenea, puteți controla acest număr setând o variabilă de mediu,
HMMER_NCPU.

Această opțiune este disponibilă numai dacă HMMER a fost compilat cu suport pentru fire POSIX.
Acesta este implicit, dar este posibil să fi fost dezactivat la momentul compilării pentru site-ul dvs
sau mașină dintr-un motiv oarecare.

--stand
Pentru depanarea versiunii MPI master/worker: întrerupeți după pornire, pentru a activa
dezvoltator să atașeze dispozitive de depanare la procesele master și worker(i) care rulează. Trimite
Semnal SIGCONT pentru a elibera pauza. (Sub gdb: (gdb) semnal NEXTCONT) (Numai
disponibil dacă suportul opțional MPI a fost activat la compilare.)

--mpi Rulați în modul MPI master/worker, folosind mpirun. (Disponibil numai dacă MPI opțional
suportul a fost activat la compilare.)

Utilizați jackhmmer online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

Comenzi Linux

Ad