Ito ang command na freecontact na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
freecontact - mabilis na protina contact predictor
SINOPSIS
freecontact [OPTION]
freecontact --parprof [evfold|psicov|psicov-sd] < alignment.aln > contacts.out
/usr/share/freecontact/a2m2aln --query '^RASH_HUMAN/(\d+)' < alignment.fa | freecontact
--parprof evfold > contacts.out
freecontact --ali=ALIFILE --apply-gapth=BOOL --clustpc=NUM --densidad=NUM --cov20=BOOL
--estimate-ivcov=BOOL --gapth=NUM --icme-timeout=NUM --input-format=[flat|xml]
--mincontsep=NUM --output-format=[evfold|pfrmat_rr|bioxsd] --pseudocnt=NUM
--pscount-weight=NUM --rho=NUM --mga thread=NUM --veczw=BOOL
freecontact --help --debug --quiet --version
DESCRIPTION
Ang FreeContact ay isang protein residue contact predictor na na-optimize para sa bilis. Maaari ang FreeContact
gumana bilang isang pinabilis na pag-drop-in para sa na-publish na mga predictor ng contact na EVfold-mfDCA ng
DS. Marks et al. (2011) [1], at PSICOV ng D. Jones et al. (2011) [2].
Ang FreeContact ay pinabilis ng kumbinasyon ng mga tagubilin sa vector, maraming thread, at
mas mabilis na pagpapatupad ng mga pangunahing bahagi. Depende sa alignment, 8-fold o mas mataas na mga speedup
ay posible.
Ang isang sapat na malaking pagkakahanay ay kinakailangan para sa makabuluhang mga resulta. Bilang isang minimum, isang
pagkakahanay sa isang mabisang (pagkatapos-pagtimbang) sequence bilang na mas malaki kaysa sa haba ng
dapat gamitin ang pagkakasunod-sunod ng query. Mga pagkakahanay na may sampu-sampung libong (epektibong) sequence
ay itinuturing na magandang input.
jackhmmer(1) o hhblits(1) ay maaaring gamitin upang bumuo ng mga pagkakahanay, halimbawa.
[1] PLoS One. 2011;6(12):e28766. doi: 10.1371/journal.pone.0028766. Epub 2011 Disyembre 7.
Protein 3D structure na nakalkula mula sa evolutionary sequence variation. Marks DS, Colwell LJ,
Sheridan R, Hopf TA, Pagnani A, Zecchina R, Sander C.
[2] Bioinformatics. 2012 Ene 15;28(2):184-90. Epub 2011 Nob 17. PSICOV: tumpak
structural contact prediction gamit ang sparse inverse covariance estimation sa large multiple
pagkakahanay ng pagkakasunod-sunod. Jones DT, Buchan DW, Cozzetto D, Pontil M.
input
Ang mga sumusunod na format ay sinusuportahan:
patag
Ang sumusunod na simpleng format ng input file ay ginagamit:
# querystart=5
# query=QUERYwithinsertionSEQUENCEWITHNOGAPSORINSERTIONS
QUERYSEQUENCEWITHNOGAPSORINSERTIONS
-NAHAY---SEQUENCE--MAY-GAPS-----
ANOTHER-ALIGNED------------SEQUENCE
Opsyonal ang mga linya ng header na '#'. Ang mga linya ng header ay ginagamit upang kalkulahin ang nalalabi ng contact
mga numero at upang maghanap ng kani-kanilang mga nalalabi sa query para sa ilang mga format ng output.
Kung walang tinukoy na query, ang unang sequence sa alignment ay gagamitin bilang query
pagkakasunod-sunod. Ang pagkakasunud-sunod ng query ay hindi dapat maglaman ng mga puwang sa pagkakahanay.
Dapat magkapareho ang haba ng lahat ng alignment row, at maaaring maglaman lamang
[ABCDEFGHIJKLMNOPQRSTUVWXYZ-]. [B] ay nakamapa sa [D], [Z] ay nakamapa sa [E], [JOUX] ay
nakamapa sa [X]. Ang [X] ay tumutugma lamang sa sarili nito para sa buong programa.
Maaaring ma-convert ang mga alignment ng input ng A2M sa format sa itaas gamit ang
/usr/share/freecontact/a2m2aln. Maaaring gamitin ang a2m2aln upang direktang i-pipe ang alignment
sa freecontact.
xml XML na dokumento na may isahttp://rostlab.org/freecontact/xsd"/>
elemento, na tinukoy sa FreeContact schema [4] na nagmula sa BioXSD [5].
Halimbawa: /usr/share/doc/freecontact/examples/PF00071_v25_1000.xml.
Pagbubuhos
Ang orihinal na EVfold-mfDCA o PSICOV na format ng output ay ginagamit bilang default kapag ang kani
napili ang profile ng parameter.
evfold (EVfold-mfDCA)
5 K 6 L 0.332129 3.59798
| | | | | + naitama na norm (CN) na marka ng contact
| | | | + marka ng mutual information (MI).
| | | + makipag-ugnayan sa amino acid residue code
| | + contact residue number
| + makipag-ugnayan sa amino acid residue code
+ contact residue number
Ang mga contact ay pinagsunod-sunod sa natitirang numero.
pfrmat_rr (PSICOV)
CASP residue-residue separation prediction (PFRMAT RR) na format [3]:
55 67 0 8 10.840280
| | | | + marka ng contact
| | +-+ range [Å] ng Cb-Cb na distansya na hinulaang para sa natitirang pares
| | (C-alpha para sa glycines)
| | Ang dalawang field na ito ay invariant sa output.
| + contact residue number
+ contact residue number
Ang mga contact ay pinagsunod-sunod sa marka, pababa.
[3]http://predictioncenter.org/casp10/index.cgi?page=format>
bioxsd
XML na dokumento na may isahttp://rostlab.org/freecontact/xsd"/>
elemento, na tinukoy sa FreeContact schema [4] na nagmula sa BioXSD [5].
Halimbawa: /usr/share/doc/freecontact/examples/PF00071_v25_1000.evfold.50.xml.
Tandaan: dahil ang BioXSD ay nasa ilalim ng aktibong pagbuo sa pakikipagtulungan sa FreeContact, ang
Ang schema ng FreeContact ay maaaring talagang hango sa isang bersyon na hindi pa available sa [5].
[4]
[5]http://bioxsd.org>
Maaaring hindi ilista ng output ang lahat ng posibleng contact.
Mga sanggunian
Naisumite. FreeContact: mabilis at libreng direktang paghula ng contact sa residue-residue.
Kaján L, Sustik MA, Marks DS, Hopf TA, Kalaš M, Rost B.
Opsyon
-a [ --threads ] arg
Mga thread na gagamitin [0-). Ang ibig sabihin ng 0 ay kasing dami ng mga core.
--apply-gapth arg
Kapag true, ibukod ang mga natitirang column at row na may weighted gap frequency > --gapth
mula sa covariance matrix [Boolean].
-c [ --clustpc ] arg
Porsyento ng clustering ng BLOSUM [0-100].
--cov20 arg
Kung totoo, mag-iwan ng isang amino acid sa covariance matrix, na ginagawa itong hindi overdetermined
[Boolean].
-d [ --density ] arg
Target precision matrix density [0-1]. Itakda 0 upang hindi makontrol ang density.
--debug
I-on ang pag-debug.
--estimate-ivcov arg
Gumamit ng inverse covariance matrix estimation sa halip na matrix inversion [Boolean].
-f [ --ali ] arg (=-)
Alignment file [path]. Kung '-', karaniwang input. Default: '-'.
-g [ --gapth ] arg
May timbang na limitasyon ng dalas ng gap (0-1).
-h [ --help ]
Gumawa ng mensahe ng tulong na ito.
-i [ --input-format ] arg (=flat)
Format ng input [flat|xml].
--icme-timeout arg (=1800)
Inverse covariance matrix estimation timeout sa mga segundo [0-). Inilapat sa bawat iversion
tumawag nang nakapag-iisa. Kung magkaroon ng timeout, lalabas ang program na may status 2.
--mincontsep arg
Minimum sequence-wise contacting residue pair separation na ibinigay sa amino acids bilang
(ji>=arg). 1 para sa mga katabing residues. [1-).
-o [ --output-format ] arg
Output format [evfold|pfrmat_rr|bioxsd].
--parprof arg (=default)
Profile ng parameter (opsyonal) [default|evfold|psicov]. Ang default na profile ay evfold.
Maaaring gamitin ang mga argumento ng command line para i-override ang mga value ng profile.
evfold
Nag-trigger ng EVfold-mfDCA [1] compatibility mode.
psicov
Pina-trigger ang mode ng pagiging tugma ng PSICOV [2].
psicov-sd
Nag-trigger sa PSICOV [2] sensible default mode: fixed default rho, walang density control.
-w [ --pscount-weight ] arg
Pseudocount na timbang [0-1].
-p [ --pseudocnt ] arg
Pseudocount [0-).
--pep
Mag-print ng mga epektibong parameter sa karaniwang error. Gamitin ang opsyong ito para makita kung anong mga parameter
freecontact(1) ay tumatakbo nang detalyado. Ito ay lalong kapaki-pakinabang kapag ang --parprof
ang opsyon ay ginagamit kasama ng iba pang mga opsyon.
--rho arg
Paunang halaga ng parameter ng regularization ng Glasso [0-). Kung negatibo, piliin ang halaga
awtomatiko.
--tahimik arg (=0)
Walang i-print kundi mga mensahe ng error sa karaniwang error. Hindi nakakaapekto --debug.
--veczw arg
Gumamit ng vectorized sequence weighting kapag available [Boolean].
--bersyon
I-print na bersyon.
EXIT STATUS
0 Walang error - tagumpay.
1 Hindi natukoy na error.
2 Isang timeout (tingnan --icme-timeout) naganap.
HALIMBAWA
/usr/share/freecontact/a2m2aln --query '^RASH_HUMAN/(\d+)' < '/usr/share/doc/freecontact/examples/PF00071_v25_1000.fa' | \
freecontact --parprof evfold > PF00071_v25_1000.evfold
freecontact --parprof evfold -i xml -o bioxsd < '/usr/share/doc/freecontact/examples/PF00071_v25_1000.xml' > PF00071_v25_1000.evfold.xml
freecontact --parprof psicov < /usr/share/doc/freecontact/examples/demo_1000.aln > demo_1000.psicov
NOTA
Para sa pinakamainam na pagganap, gamitin ang Automatically Tuned Linear Algebra Software (ATLAS)
aklatan naipon on ang makina kung saan pinapatakbo ang freecontact.
Gumamit ng freecontact online gamit ang mga serbisyo ng onworks.net