InglesPransesEspanyol

Ad


OnWorks favicon

cmcalibrate - Online sa Cloud

Patakbuhin ang cmcalibrate sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command cmcalibrate na maaaring patakbuhin sa OnWorks free hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


cmcalibrate - magkasya sa exponential tails para sa covariance model E-value determination

SINOPSIS


cmcalibrate [mga pagpipilian] cmfile

DESCRIPTION


cmcalibrate tinutukoy ang mga parameter ng exponential tail para sa pagpapasiya ng E-value sa pamamagitan ng pagbuo
mga random na pagkakasunud-sunod, hinahanap ang mga ito gamit ang CM at kinokolekta ang mga marka ng resulta
mga hit. Ang isang histogram ng mga bit na marka ng mga hit ay akma sa isang exponential tail, at ang
ang mga parameter ng fitted tail ay nai-save sa CM file. Ang mga parameter ng exponential tail
pagkatapos ay ginagamit upang tantyahin ang istatistikal na kahalagahan ng mga hit na matatagpuan sa cmsearch at
cmscan.

Dapat na naka-calibrate ang isang CM file cmcalibrate bago ito magamit sa cmsearch or cmscan,
na may isang pagbubukod: hindi kinakailangang i-calibrate ang mga CM file na kasama lang
mga modelong may zero na basepairs bago tumakbo cmsearch.

cmcalibrate ay napakabagal. Tumatagal ng ilang oras upang ma-calibrate ang isang average na laki
CM sa isang CPU. cmcalibrate ay tatakbo sa parallel sa lahat ng magagamit na mga core kung Infernal
ay binuo sa isang sistema na sumusuporta sa POSIX threading (tingnan ang seksyon ng Pag-install ng
gabay sa gumagamit para sa higit pang impormasyon). Gamit ang mga core ay magreresulta sa halos Fold
acceleration laban sa isang CPU. MPI (Message Passing Interface) ay maaari ding gamitin para sa
parallelization sa --mpi opsyon kung ang Infernal ay binuo gamit ang MPI na pinagana, ngunit ginagamit
higit sa 161 processor ay hindi inirerekomenda dahil ang pagtaas ng lampas 161 ay hindi mabibilis
ang pagkakalibrate. Tingnan ang seksyon ng Pag-install ng gabay sa gumagamit para sa higit pang impormasyon.

Ang --pagtataya ang opsyon ay maaaring gamitin upang tantyahin kung gaano katagal ang programa ay tatagal upang tumakbo para sa a
naibigay na cmfile sa kasalukuyang makina. Upang mahulaan ang oras ng pagtakbo sa mga processor na may
MPI, dagdag na gamitin ang --pagtataya pagpipilian.

Hinanap ang mga random na sequence cmcalibrate ay nabuo ng isang HMM na sinanay sa
totoong genomic sequence na may iba't ibang nilalaman ng GC. Ang layunin ay magkaroon ng mga pamamahagi ng GC
sa mga random na pagkakasunud-sunod ay katulad ng sa mga aktwal na genomic na pagkakasunud-sunod.

Apat na round ng mga paghahanap at kasunod na exponential tail fit ay isinasagawa, isa bawat isa para sa
ang apat na magkakaibang CM algorithm na maaaring gamitin sa cmsearch at cmscan: glocal CYK,
glocal Inside, local CYK at local Inside.

Ang mga parameter ng E-values ​​na tinutukoy ng cmcalibrate ay ginagamit lamang ng mga cmsearch at cmscan
mga programa. Kung hindi mo gagamitin ang mga program na ito, huwag mag-aksaya ng oras sa pag-calibrate
iyong mga modelo.

Opsyon


-h Tulong; mag-print ng maikling paalala ng paggamit ng command line at mga available na opsyon.

-L Itakda ang kabuuang haba ng mga random na sequence na hahanapin mga megabase (Mb). Sa pamamagitan ng
default, is 1.6 Mb. Tumataas gagawing mas magkasya ang exponential tail
precise at E-values ​​na mas tumpak, ngunit mas magtatagal (pagdodoble ay halos
doble ang oras ng pagtakbo). Bumababa ay hindi inirerekomenda dahil gagawin nito ang
magkasya sa hindi gaanong tumpak at ang mga E-values ​​ay hindi gaanong tumpak.

Opsyon PARA SA PAGHULA KAILANGAN TIME AT ALAALA


--pagtataya
Hulaan ang oras ng pagtakbo ng pagkakalibrate ng cmfile (na may ibinigay na mga opsyon) sa
ang kasalukuyang makina at labasan. Ang pagkakalibrate ay hindi ginaganap. Ang mga hula
dapat ituring na mga magaspang na pagtatantya. Kung pinagana ang multithreading (tingnan ang
Seksyon ng pag-install ng gabay ng gumagamit), isasaalang-alang ng timing ang numero
ng magagamit na mga core.

--pagtataya
may --pagtataya, tukuyin iyon ang mga processor ay gagamitin para sa pagkakalibrate.
Ito ay maaaring maging kapaki-pakinabang para sa paghula sa oras ng pagtakbo ng isang MPI run na may
processors.

--memreq
Hulaan ang dami ng kinakailangang memory para sa pag-calibrate cmfile (kasama ang ibinigay
mga opsyon) sa kasalukuyang makina at labasan. Ang pagkakalibrate ay hindi ginaganap.

Opsyon KONTROL EXPONENTIAL BUNTOT FITS


--gtailn
magkasya ang exponential tail para sa glocal Inside at glocal CYK sa pinakamataas na marka
sa histogram tail, kung saan is beses ang bilang ng Mb na hinanap. Ang
default na halaga ng ay 250. Napili ang value na 250 dahil ito ay gumagana nang maayos
empirically na may kaugnayan sa iba pang mga halaga.

--ltailn
magkasya ang exponential tail para sa lokal na Inside at lokal na CYK sa pinakamataas na marka
sa histogram tail, kung saan is beses ang bilang ng Mb na hinanap. Ang
default na halaga ng ay 750. Napili ang value na 750 dahil ito ay gumagana nang maayos
empirically na may kaugnayan sa iba pang mga halaga.

--buntot
Huwag pansinin ang --gtailn at --ltailn prefixed na mga opsyon at magkasya sa fraction tail ng
ang histogram sa isang exponential tail, para sa lahat ng mga mode ng paghahanap.

OPSYONAL oUTPUT MGA FILE


--hfile
I-save ang histograms fit to file . Dalawang espasyo ang format ng file na ito
nililimitahan ang mga column sa bawat linya. Ang unang column ay ang mga halaga ng x-axis ng mga bit score ng
bawat bin. Ang pangalawang column ay ang mga halaga ng y-axis ng bilang ng mga hit sa bawat bin. Bawat isa
ang serye ay nililimitahan ng isang linyang may iisang karakter na "&". Maglalaman ang file
isang serye para sa bawat isa sa apat na exponential tail ay umaangkop sa sumusunod na pagkakasunud-sunod:
glocal CYK, glocal Inside, lokal na CYK, at lokal na Inside.

--sfile
I-save ang impormasyon ng survival plot sa file . Dalawang espasyo ang format ng file na ito
nililimitahan ang mga column sa bawat linya. Ang unang column ay ang mga halaga ng x-axis ng mga bit score ng
bawat bin. Ang pangalawang column ay ang mga halaga ng y-axis ng fraction ng mga hit na nakakatugon sa o
lumampas sa iskor para sa bawat bin. Ang bawat serye ay nililimitahan ng isang linya na may isang solong
karakter na "&". Maglalaman ang file ng tatlong serye ng data para sa bawat isa sa apat na CM
mga mode ng paghahanap sa sumusunod na pagkakasunud-sunod: glocal CYK, glocal Inside, lokal na CYK, at
lokal sa loob. Ang unang serye ay ang empirical survival plot mula sa histogram
ng mga hit sa random na pagkakasunod-sunod. Ang pangalawang serye ay ang exponential tail fit to
ang empirical distribution. Ang ikatlong serye ay ang exponential tail fit kung lambda
ay naayos at itinakda bilang natural na log ng 2 (0.691314718).

--qqfile
I-save ang quantile-quantile plot na impormasyon sa file . Ang format ng file na ito ay
dalawang column na nililimitahan ng espasyo bawat linya. Ang unang column ay ang mga halaga ng x-axis, at
ang pangalawang hanay ay ang mga halaga ng y-axis. Ang distansya ng mga puntos mula sa
Ang linya ng pagkakakilanlan (y=x) ay isang sukatan kung gaano kahusay ang exponential tail fit, ang
mas malapit ang mga punto sa linya ng pagkakakilanlan, mas mahusay ang akma. Ang bawat serye ay
nililimitahan ng isang linyang may iisang character na "&". Maglalaman ang file ng isang serye
ng empirical data para sa bawat isa sa apat na exponential tail ay akma sa sumusunod
order: glocal CYK, glocal Inside, local CYK at local Inside.

--file
I-save ang space delimited statistics ng iba't ibang exponential tail na akma sa file .
Maglalaman ang file ng mga halaga ng lambda at mu para sa mga exponential tails na akma sa
histogram tails ng iba't ibang laki. Ang mga patlang sa file ay may label
informatively.

--xfile
Mag-save ng listahan ng mga score sa bawat fit histogram tail sa file . Ang bawat linya ng
ang file na ito ay magkakaroon ng ibang marka na nagsasaad ng isang hit na umiral sa buntot na may
yung score. Ang bawat serye ay nililimitahan ng isang linyang may iisang karakter na "&". Ang
Ang file ay maglalaman ng isang serye para sa bawat isa sa apat na exponential tail na akma sa
sumusunod na pagkakasunud-sunod: glocal CYK, glocal Inside, lokal na CYK, at lokal na Inside.

OTHER Opsyon


--binhi
Binhi ang random number generator gamit ang , isang integer >= 0. Kung ay hindi zero,
stochastic simulation ay maaaring kopyahin; ang parehong utos ay magbibigay ng pareho
resulta. Kung ay 0, ang generator ng random na numero ay na-seed nang arbitraryo, at
Ang mga stochastic simulation ay mag-iiba mula sa run hanggang run ng parehong command. Ang default
ang buto ay 181.

--beta
Bilang default, ginagamit ang query-dependent banding (QDB) upang pabilisin ang paghahanap sa CM
mga algorithm na may posibilidad na mawala ang buntot ng beta na 1E-15. Ang beta value na ito ay maaaring
binago sa sa --beta . Ang beta parameter ay ang halaga ng posibilidad
mass na hindi kasama sa pagkalkula ng banda, ang mas mataas na halaga ng beta ay nagbibigay ng mas malaking speedup
ngunit nagsasakripisyo ng higit na katumpakan kaysa sa mas mababang halaga. Ang ginamit na default na halaga ay 1E-15.
(Para sa karagdagang impormasyon sa QDB tingnan ang Nawrocki at Eddy, PLoS Computational Biology
3(3): e56.)

--nonbanded
I-off ang QDB sa panahon ng E-value calibration. Ito ay magpapabagal sa pagkakalibrate.

--nonull3
I-off ang null3 post hoc karagdagang null model. Hindi ito inirerekomenda maliban kung
plano mong gamitin ang parehong opsyon sa cmsearch at / o cmscan.

--random
Gamitin ang background null model ng CM upang bumuo ng mga random na sequence, sa halip
ng mas makatotohanang HMM. Maliban kung ang CM ay binuo gamit ang --wala pagpipilian sa
cmbuild, ang background null model ay magiging 25% bawat A, C, G at U.

--gc
Bumuo ng mga random na sequence gamit ang nucleotide distribution mula sa sequence
file .

--cpu
Tukuyin iyon parallel na manggagawa ng CPU ang gagamitin. Kung ay nakatakda bilang "0", pagkatapos ay ang
Ang programa ay tatakbo sa serial mode, nang hindi gumagamit ng mga thread. Maaari mo ring kontrolin
ang numerong ito sa pamamagitan ng pagtatakda ng environment variable, INFERNAL_NCPU. Ang pagpipiliang ito ay
magagamit lamang kung ang makina kung saan itinayo ang Infernal ay may kakayahang gamitin
POSIX threading (tingnan ang seksyong Pag-install ng gabay sa gumagamit para sa higit pa
impormasyon).

--mpi Patakbuhin bilang isang MPI parallel program. Magiging available lang ang opsyong ito kung mayroon ang Infernal
na-configure at binuo gamit ang flag na "--enable-mpi" (tingnan ang Installation
seksyon ng gabay sa gumagamit para sa higit pang impormasyon).

Gumamit ng cmcalibrate online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

Linux command

Ad