cmemit - Online sa Cloud

Ito ang command cmemit na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


cmemit - sample sequence mula sa isang covariance model

SINOPSIS


cmemit [mga pagpipilian]

DESCRIPTION


Ang cmemit mga sample ng program (naglalabas) ng mga sequence mula sa (mga) modelo ng covariance sa , at
isinusulat ang mga ito sa output. Maaaring maging kapaki-pakinabang ang mga sampling sequence para sa iba't ibang layunin,
kabilang ang paggawa ng mga sintetikong totoong positibo para sa mga benchmark o pagsubok.

Ang default ay ang sample ng sampung hindi nakahanay na pagkakasunud-sunod mula sa bawat CM. Bilang kahalili, kasama ang -c
opsyon, maaari kang maglabas ng isang pagkakasunud-sunod ng pinagkasunduan ng karamihan sa panuntunan; o kasama ang -a option, ikaw
maaaring maglabas ng pagkakahanay.

Ang ay maaaring maglaman ng library ng mga CM, kung saan ang bawat CM ay gagamitin naman.

maaaring '-' (gitling), na nangangahulugang binabasa ang input na ito mula sa si stdin sa halip na isang file.

Para sa mga modelong may zero na basepairs, ang mga sequence ay na-sample mula sa profile HMM filter sa halip
ng CM. Gayunpaman, dahil ang mga modelong ito ay halos magkapareho (maliban kung mga espesyal na opsyon
ay ginamit sa cmbuild upang maiwasan ito), ang paggamit ng HMM sa halip na ang CM ay hindi magbabago sa
output sa isang makabuluhang paraan, maliban kung ang -l ginagamit ang opsyon. Sa -l, ang magiging HMM
naka-configure para sa equiprobable na mga posisyon sa pagsisimula at pagtatapos ng modelo, habang ang CM ay hindi. Kaya mo
pilitin cmemit para laging sample mula sa CM na may --nohmmonly pagpipilian.

Opsyon


-h Tulong; mag-print ng maikling paalala ng paggamit ng command line at mga available na opsyon.

-o I-save ang mga synthetic na pagkakasunud-sunod upang mai-file sa halip na isulat ang mga ito sa stdout.

-N lumikha mga pagkakasunod-sunod. Ang default na halaga para sa ay 10.

-u Isulat ang mga nabuong sequence sa hindi nakahanay na format (FASTA). Ito ang default
pag-uugali.

-a Isulat ang mga nabuong pagkakasunud-sunod sa isang nakahanay na format (STOCKHOLM) nang may pinagkasunduan
anotasyon ng istraktura sa halip na FASTA. Ang iba pang mga format ng output ay posible sa
--outformat pagpipilian.

-c Hulaan ang isang pagkakasunud-sunod ng pinagkasunduan ng karamihan sa panuntunan sa halip na mga pagkakasunud-sunod ng sampling
mula sa pamamahagi ng posibilidad ng CM. Highly conserved residues (base paired
mga residu na mas mataas ang marka kaysa sa 3.0 bits, o mga solong stranded na residu na may marka
mas mataas sa 1.0 bits) ay ipinapakita sa upper case; ang iba ay ipinapakita sa maliit na titik.

-e I-embed ang CM emitted sequence sa mas malaking random na nabuong sequence ng haba
nabuo mula sa isang HMM na sinanay sa mga tunay na genomic sequence na may iba't ibang
Mga nilalaman ng GC (kaparehong HMM na ginamit ni cmcalibrate). Maaari mong gamitin ang --iid pagpipilian sa
bumuo ng 25% A, C, G, at U sequence sa halip. Magsisimula ang CM emitted sequence
sa isang random na posisyon sa loob ng mas malaking sequence at isasama sa nito
kabuuan maliban kung ang --u5p or --u3p ginagamit ang mga opsyon. Kailan -e ay ginagamit sa
kumbinasyon sa --u5p, ang CM emitted sequence ay palaging magsisimula sa posisyon 1 ng
ang mas malaking sequence at puputulin ng 5'. Kapag ginamit sa kumbinasyon --u3p ang CM
ang nailabas na sequence ay palaging magtatapos sa posisyon ng mas malaking sequence at magiging
pinutol 3'.

-l I-configure ang mga CM sa local mode bago maglabas ng mga sequence. Bilang default ang modelo
ay nasa global mode. Sa lokal na mode, mas marami ang malalaking pagsingit at pagtanggal
karaniwan kaysa sa global mode.

Opsyon PARA SA PAGTUTOL NAPALABAS MGA PAGSUNOD


--u5p Putulin ang lahat ng mga nailabas na pagkakasunud-sunod sa isang random na napiling panimulang posisyon , sa pamamagitan lamang
outputting residues simula sa . Ang ibang panimulang punto ay random na pinili
para sa bawat sequence.

--u3p Putulin ang lahat ng mga nailabas na pagkakasunud-sunod sa isang random na napiling posisyon ng pagtatapos , sa pamamagitan lamang
outputting residues hanggang sa posisyon . Ang ibang punto ng pagtatapos ay random na pinili
para sa bawat sequence.

--a5p
Kasabay ng -a opsyon, putulin ang inilabas na pagkakahanay nang random
napiling panimulang posisyon ng tugma , sa pamamagitan lamang ng pag-output ng mga column ng alignment para sa mga posisyon
pagkatapos ng estado ng tugma - 1. dapat ay isang integer sa pagitan ng 0 at ng consensus
haba ng modelo (na maaaring matukoy gamit ang cmstat programa. Bilang isang espesyal
kaso, gamit ang 0 bilang ay magreresulta sa random na piniling panimulang posisyon.

--a3p
Kasabay ng -a opsyon, putulin ang inilabas na pagkakahanay nang random
napiling posisyon sa pagtatapos ng tugma , sa pamamagitan lamang ng pag-output ng mga column ng alignment para sa mga posisyon
bago ang estado ng tugma + 1. dapat ay isang integer sa pagitan ng 1 at ng consensus
haba ng modelo (na maaaring matukoy gamit ang cmstat programa). Bilang isang
espesyal na kaso, gamit ang 0 bilang ay magreresulta sa isang random na napiling posisyon sa pagtatapos.

OTHER Opsyon


--binhi
Binhi ang random number generator gamit ang , isang integer >= 0. Kung ay hindi zero,
stochastic sampling ng mga sequence ay maaaring kopyahin; ang parehong utos ay ibibigay
ang parehong mga resulta. Kung ay 0, ang generator ng random na numero ay binibinhi nang arbitraryo,
at ang mga stochastic sampling ay mag-iiba mula sa run hanggang run ng parehong command. Ang
ang default na binhi ay 0.

--iid may -e, bumuo ng mas malalaking sequence bilang 25% bawat A, C, G at U.

--rna Tukuyin na ang mga emitted sequence ay output bilang RNA sequence. Ito ay totoo sa pamamagitan ng
default.

--dna Tukuyin na ang mga emitted sequence ay output bilang DNA sequence. Bilang default, ang
ang output alphabet ay RNA.

--idx
Tukuyin na ang mga nailabas na sequence ay pinangalanan simula sa . . By
default ay 1.

--outformat
may -a, tukuyin ang format ng pag-align ng output bilang . Ang mga katanggap-tanggap na format ay: Pfam,
AFA, A2M, Clustal, at Phylip. Ang AFA ay mabilis na nakahanay. Tanging ang Pfam at Stockholm
isasama sa mga format ng alignment ang consensus structure annotation.

--tfile
Dump tabular sequence parsetrees (tracebacks) para sa bawat emitted sequence to file
. Pangunahing kapaki-pakinabang para sa pag-debug.

--exp
Exponentiate ang emission at transition probabilities ng CM sa pamamagitan ng at pagkatapos ay
i-renormalize ang mga distribusyon na iyon bago maglabas ng mga sequence. Binabago ng opsyong ito ang
Pamamahagi ng posibilidad ng CM ng mga parsetre na nauugnay sa default. Sa mas mababa sa
1.0 ang mga ibinubuga na pagkakasunud-sunod ay malamang na magkaroon ng mas mababang mga marka ng bit sa pagkakahanay sa
CM. Sa higit sa 1.0, ang mga ibinubuga na sequence ay malamang na magkaroon ng mas mataas na bit
mga marka sa pagkakahanay sa CM. Ang kaunting pagkakaiba ng marka na ito ay tataas bilang
mas lumalayo sa 1.0 sa alinmang direksyon. Kung katumbas ng 1.0, ang pagpipiliang ito
walang epekto kaugnay sa default. Ang pagpipiliang ito ay kapaki-pakinabang para sa pagbuo ng mga pagkakasunud-sunod
na mas mahirap ( < 1.0) o mas madali ( > 1.0) para sa CM
makilala bilang homologous mula sa background, random sequence.

--hmmonly
Ilabas mula sa filter na profile HMM sa halip na sa CM.

--nohmmonly
Huwag kailanman maglabas mula sa profile ng filter na HMM, palaging gamitin ang CM, kahit na para sa mga modelong may
zero basepairs.

Gamitin ang cmemit online gamit ang mga serbisyo ng onworks.net



Pinakabagong Linux at Windows online na mga programa