EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

hmmsim - Online în cloud

Rulați hmmsim în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda hmmsim care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


hmmsim - colectează distribuții de scor pe secvențe aleatorii

REZUMAT


hmmsim [Opțiuni]

DESCRIERE


hmmsim programul generează secvențe aleatoare, le punctează cu modelul(ele) în ,
și emite diferite tipuri de histograme, diagrame și distribuții adaptate pentru rezultatul
înscris.

hmmsim nu este o parte principală a pachetului HMMER. Majoritatea utilizatorilor nu ar avea de ce
foloseste-l. Este folosit pentru a dezvolta și testa metodele statistice utilizate pentru determinarea valorilor P
și valorile E în HMMER3. De exemplu, a fost folosit pentru a genera majoritatea rezultatelor într-un 2008
lucrare despre statisticile de aliniere locală a H3 (PLoS Comp Bio 4:e1000069, 2008;
http://www.ploscompbiol.org/doi/pcbi.1000069).

Deoarece este un banc de testare de cercetare, nu ar trebui să vă așteptați să fie la fel de robust ca altele
programele din pachet. De exemplu, opțiunile pot interacționa în moduri ciudate; noi nu avem
a testat și nici nu a încercat să anticipeze toate combinațiile posibile diferite.

Sarcina principală este de a potrivi o distribuție Gumbel cu probabilitate maximă la scorurile Viterbi sau an
probabilitate maximă coadă exponențială la scoruri înaintate cu scoruri mari și pentru a testa că acestea
distribuţiile fitted se supun conjecturii că lambda ~ log_2 atât pentru Viterbi Gumbel
și coada exponențială înainte.

Rezultatul este un tabel de numere, un rând pentru fiecare model. Patru potriviri parametrice diferite
la scor sunt testate datele: (1) probabilitatea maximă se potrivește atât cu locația (mu/tau) cât și
parametrii de pantă (lambda); (2) presupunând lambda=log_2, probabilitatea maximă se potrivește la
numai parametrul locației; (3) același, dar presupunând o lambda corectată de margine, folosind curent
proceduri în H3 [Eddy, 2008]; și (4) folosind ambii parametri determinați de curentul lui H3
proceduri. Statistica standard simplă, rapidă și murdară pentru bunătatea potrivirii este „E@10”,
valoarea E calculată a loviturii de top clasată pe locul 10, care ne așteptăm să fie de aproximativ 10.

În detaliu, coloanele rezultatelor sunt:

nume Denumirea modelului.

coada Fracțiunea dintre cele mai mari scoruri utilizate pentru a se potrivi distribuției. Pentru Viterbi, MSV și
Scoruri hibride, aceasta este implicită la 1.0 (o distribuție Gumbel este potrivită pentru toate
date). Pentru scorurile Forward, aceasta este implicită la 0.02 (la care este montată o coadă exponențială
cele mai mari scoruri de 2%).

mu/tau Parametru de locație pentru probabilitatea maximă de potrivire la date.

lambda Parametrul de pantă pentru probabilitatea maximă de potrivire la date.

E@10 Valoarea E calculată pentru al 10-lea scor mare („E@10”) folosind ML mu/tau
și lambda. Prin definiție, aceasta se aștepta să fie de aproximativ 10, dacă estimarea valorii E ar fi
exacte.

mufix Parametru de locație, pentru o potrivire cu o probabilitate maximă cu o pantă cunoscută (fixă).
parametrul lambda al log_2 (0.693).

E@10fix
Valoarea E calculată pentru scorul clasat pe locul 10 folosind mufix și cel așteptat
lambda = log_2 = 0.693.

mufix2 Parametru de locație, pentru o potrivire maximă cu un efect de margine corectat
lambda.

E@10fix2
Valoarea E calculată pentru scorul clasat al 10-lea utilizând mufix2 și efectul de margine-
lambda corectată.

PMU Parametrul de locație determinat de procedurile de estimare ale H3.

plambda
Parametrul pantei determinat de procedurile de estimare ale H3.

pE@10 Valoarea E calculată pentru scorul clasat pe locul 10 utilizând pmu, plambda.

La sfârșitul acestui tabel, este imprimată încă o linie, care începe cu # și rezumă
timpul general CPU utilizat de simulări.

Unele dintre fișierele de ieșire opționale sunt în format xmgrace xy. xmgrace este puternic și liber
software-ul disponibil pentru trasarea graficelor.

DIVERSE OPŢIUNI


-h Ajutor; imprimați un scurt memento cu privire la utilizarea liniei de comandă și toate opțiunile disponibile.

-a Colectați statisticile așteptate privind lungimea alinierii Viterbi din fiecare secvență simulată.
Acest lucru funcționează numai cu scorurile Viterbi (implicit; vezi --vit). Două în plus
câmpurile sunt tipărite în tabelul de ieșire pentru fiecare model: lungimea medie a Viterbi
aliniamentele și deviația standard.

-v (Verbos). Imprimați și scorurile, câte un scor pe linie.

-L Setați lungimea secvențelor eșantionate aleatoriu (neomolog) la .
implicit este 100.

-N Setați numărul de secvențe eșantionate aleatoriu la . Valoarea implicită este 1000.

--mpi Rulați în modul paralel MPI, sub mpirun. Este paralelizat la nivel de trimitere
câte un profil la un proces de lucru MPI, deci paralelizarea ajută doar dacă
ai mai mult de un profil în , și vrei să ai cel puțin ca
multe profiluri ca procese de lucrător MPI. (Disponibil numai dacă suportul MPI opțional a fost
activat la compilare.)

OPŢIUNI CONTROLUL REZULTATE


-o Salvați tabelul principal de ieșire într-un fișier mai degrabă decât să-l trimită la stdout.

--un fișier
La colectarea statisticilor de aliniament Viterbi (the -a opțiune), pentru fiecare eșantionat
secvență, scoateți două câmpuri pe linie într-un fișier : lungimea optimului
alinierea și scorul de biți Viterbi. Necesită ca -a este folosită și opțiunea.

--efile
Ieșiți o diagramă de rang vs. E-valoare în format XMGRACE xy în fișier . Axa x este
rangul acestei secvențe, de la cel mai mare scor la cel mai mic; axa y este valoarea E
calculat pentru această secvență. Valorile E sunt calculate folosind procedurile implicite ale H3
(adică parametrii pmu, plambda din tabelul de ieșire). Te aștepți la un meci dur
între rang și valoarea E dacă valorile E sunt estimate cu precizie.

--file
Ieșiți un fișier „putere de filtru” la : pentru fiecare model, o linie cu trei câmpuri:
numele modelului, numărul de secvențe care trec pragul valorii P și fracțiunea de
secvențe care trec pragul valorii P. Vedea --pthresh pentru setarea valorii P
prag, care este implicit la 0.02 (pragul implicit al filtrului MSV în H3). P-
valorile sunt determinate de procedurile implicite ale H3 (parametrii pmu,plambda din
tabelul de ieșire). Dacă totul este bine, vă așteptați să vedeți puterea filtrului egală cu
setarea preconizată a valorii P a pragului.

--pfile
Trimiteți diagramele de supraviețuire cumulative (P(S>x)) în fișier în format XMGRACE xy. Acolo
sunt trei diagrame: (1) distribuția scorului observat; (2) probabilitatea maximă
distributie montata; (3) o probabilitate maximă potrivită cu parametrul locației
(mu/tau) în timp ce
presupunând lambda=log_2.

--xfile
Ieșiți scorurile de biți ca o matrice binară de float cu precizie dublă (8 octeți per
scor) a dosar . Programe precum Easel's esl-histplot poate citi astfel de fișiere binare.
Acest lucru este util atunci când se generează eșantion de dimensiuni extrem de mari.

OPŢIUNI CONTROLUL MODEL CONFIGURARE (MODĂ)


H3 folosește doar alinierea locală cu mai multe lovituri ( --fs mod), și aici credem că
potriviri statistice. Scoruri de aliniere locală Unihit (Smith/Waterman; --sw mod) se supun de asemenea noastre
presupuneri statistice. Statisticile de aliniere glocală (fie multihit, fie unihit) sunt
încă neînțeles în mod adecvat și nici adaptat în mod adecvat.

--fs Colectați scoruri de aliniere locală cu mai multe lovituri. Aceasta este valoarea implicită. aliniere ca
„modul de căutare fragment”.

--sw Colectați scoruri de aliniere locală unihit. Starea H3 J este dezactivată. aliniere ca
„Modul de căutare Smith/Waterman”.

--ls Colectați scoruri de aliniere glocală cu mai multe lovituri. În alinierea glocală (globală/locală), cel
întregul model trebuie să se alinieze la o subsecvență a țintei. Intrarea/ieșirea locală H3
probabilitățile de tranziție sunt dezactivate. „ls” provine din istoricul HMMER2
terminologia pentru alinierea locală cu mai multe lovituri ca „mod de căutare locală”.

--s Colectați scoruri de aliniere glocală unihit. Atât H3 J de stat, cât și de intrare/ieșire locală
probabilitățile de tranziție sunt dezactivate. „s” provine din istoricul HMMER2
terminologie pentru alinierea glocală unihit.

OPŢIUNI CONTROLUL PUNTAREA ALGORITM


--vit Colectați scorurile de aliniere de probabilitate maximă Viterbi. Aceasta este valoarea implicită.

--fwd Colectați scorurile de probabilitate de log-cote Forward, însumate peste ansamblul de aliniere.

--hib Colectați scoruri „hibride”, așa cum este descris în lucrările lui Yu și Hwa (de exemplu,
Bioinformatics 18:864, 2002). Acestea implică calcularea unei matrice Forward și luarea
valoarea maximă a celulei. Numărul în sine este statistic oarecum nemotivat,
dar distribuția este de așteptat să fie o distribuție de valori extreme bine comportată
(Gumbel).

--msv Colectați scoruri MSV (multiple ungapped segment Viterbi), folosind principalul H3
euristica accelerației.

--rapid Pentru oricare dintre opțiunile de mai sus, utilizați implementarea de producție optimizată a lui H3 (folosind
vectorizare SIMD). Implicit este de a utiliza implementările sacrifica un mic
cantitatea de precizie numerică. Acest lucru poate introduce zgomot confuz în
simulări statistice și potriviri, deci atunci când cineva devine super preocupat de exact
detalii, este mai bine să puteți lua în considerare acea sursă de zgomot.

OPŢIUNI CONTROLUL MONTATE COADĂ MASE PENTRU REDIRECŢIONA


În unele experimente, a fost util să se potrivească scorurile Forward la o serie de cozi diferite
masele, mai degrabă decât doar una. Aceste opțiuni oferă un mecanism pentru montarea uniformă a unui
interval distanțat de mase diferite ale cozii. Pentru fiecare masă de coadă diferită, este generată o linie
în ieșire.

--tmin
Setați limita inferioară a distribuției masei cozii. (Valoarea implicită este 0.02 pentru
masa de coadă implicită.)

--tmax
Setați limita superioară a distribuției masei cozii. (Valoarea implicită este 0.02 pentru
masa de coadă implicită.)

--tpuncte
Setați numărul de mase ale cozii de eșantionat, începând de la --tmin și se termină la --tmax.
(Valoarea implicită este 1, pentru masa implicită de 0.02 cu o singură coadă.)

--liniar
Eșantionați o gamă de mase de coadă cu distanță liniară uniformă. Implicit este utilizarea
distanță logaritmică uniformă.

OPŢIUNI CONTROLUL H3 PARAMETRI ESTIMARE METODE


H3 folosește trei simulări scurte de secvențe aleatorii pentru a estima parametrii de locație pentru
distribuțiile așteptate ale scorurilor pentru scorurile MSV, scorurile Viterbi și scorurile Forward. Aceste
opțiunile permit modificarea acestor simulări.

--EmL
Setează lungimea secvenței în simulare care estimează parametrul de locație mu pentru
Valorile E MSV. Implicit este 200.

--EmN
Setează numărul de secvențe din simulare care estimează parametrul de locație mu
pentru valorile E MSV. Implicit este 200.

--EvL
Setează lungimea secvenței în simulare care estimează parametrul de locație mu pentru
Viterbi E-valori. Implicit este 200.

--EvN
Setează numărul de secvențe din simulare care estimează parametrul de locație mu
pentru Viterbi E-valori. Implicit este 200.

--EfL
Setează lungimea secvenței în simulare care estimează parametrul de locație tau
pentru Forward E-value. Implicit este 100.

--EfN
Setează numărul de secvențe din simulare care estimează parametrul locației
tau pentru Forward E-value. Implicit este 200.

--Eft
Setează fracția de masă a cozii pentru a se potrivi în simularea care estimează locația
parametrul tau pentru evaluările Forward. Implicit este 0.04.

DEBUGARE OPŢIUNI


--stand
Pentru depanarea versiunii MPI master/worker: întrerupeți după pornire, pentru a activa
dezvoltator să atașeze dispozitive de depanare la procesele master și worker(i) care rulează. Trimite
Semnal SIGCONT pentru a elibera pauza. (Sub gdb: (gdb) semnal NEXTCONT) (Numai
disponibil dacă suportul opțional MPI a fost activat la compilare.)

--samanta
Setați sămânța numărului aleatoriu la . Valoarea implicită este 0, ceea ce face un număr aleatoriu
generatorul folosește o sămânță arbitrară, astfel încât diferite rulări de hmmsim va aproape
generează cu siguranță un eșantion statistic diferit. Pentru depanare, este util să
forță rezultatele reproductibile, prin fixarea unui număr aleatoriu de semințe.

EXPERIMENTAL OPŢIUNI


Aceste opțiuni au fost utilizate într-o varietate mică de experimente exploratorii diferite.

--bgflat
Setați distribuția de reziduuri de fundal la o distribuție uniformă, atât pentru
scopurile modelului nul utilizat în calcularea scorurilor și pentru generarea
secvențe aleatorii. Implicit este utilizarea unei frecvențe de fundal standard a aminoacizilor
distribuție.

--bgcomp
Setați distribuția reziduurilor de fundal la compoziția medie a profilului.
Acesta a fost folosit pentru a explora unele dintre efectele compoziției părtinitoare.

--x-no-lengthmodel
Opriți modelul de lungime a secvenței țintă H3. Setați autotranzițiile pentru N,C,J
iar modelul nul la 350/351 în schimb; aceasta emulează HMMER2. Nu este o idee bună în
general. Aceasta a fost folosită pentru a demonstra una dintre principalele diferențe H2 vs. H3.

--nu
Setați parametrul nu pentru algoritmul MSV -- numărul așteptat de local negapped
aliniamente pe secvența țintă. Valoarea implicită este 2.0, corespunzătoare unui E->J
probabilitate de tranziție de 0.5. Acesta a fost folosit pentru a testa dacă nu are variație
efect semnificativ asupra rezultatului (nu pare să fie, în limite rezonabile). Doar această opțiune
functioneaza daca --msv este selectat (afectează doar MSV) și nu va funcționa cu --rapid
(deoarece implementările optimizate sunt cablate pentru a presupune nu=2.0).

--pthresh
Setați pragul valorii P a filtrului pe care să îl utilizați la generarea fișierelor cu puterea filtrului
--file. Valoarea implicită este 0.02 (care ar fi potrivit pentru testarea scorurilor MSV,
deoarece acesta este pragul implicit al filtrului MSV în conducta de accelerație a lui H3.)
Alte opțiuni adecvate (potrivire cu valorile implicite în conducta de accelerare) ar fi
0.001 pentru Viterbi și 1e-5 pentru Forward.

Utilizați hmmsim online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

Comenzi Linux

Ad