Ito ang command na cdhit-454 na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
cd-hit-454 - mabilis na pagkakasunud-sunod ng pangkat, na-optimize para sa 454 data
SINOPSIS
cdhit-454 [Options]
DESCRIPTION
====== CD-HIT na bersyon 4.6 (itinayo noong Ene 23 2016) ======
Options
-i input filename sa fasta format, kinakailangan
-o output filename, kinakailangan
-c sequence identity threshold, default 0.98 ito ay isang "global sequence identity"
kinakalkula bilang : bilang ng magkakahawig na mga amino acid sa pagkakahanay na hinati sa kabuuan
haba ng mas maikling sequence + gaps
-b band_width ng alignment, default 10
-M limitasyon ng memorya (sa MB) para sa programa, default na 800; 0 para sa walang limitasyon;
-T bilang ng mga thread, default 1; na may 0, lahat ng mga CPU ay gagamitin
-n word_length, default 10, tingnan ang gabay ng gumagamit para sa pagpili nito
-aL alignment coverage para sa mas mahabang sequence, default na 0.0 kung nakatakda sa 0.9, ang
Ang pagkakahanay ay dapat sumasakop sa 90% ng pagkakasunud-sunod
-AL alignment coverage control para sa mas mahabang sequence, default na 99999999 kung nakatakda sa 60,
at ang haba ng sequence ay 400, kung gayon ang alignment ay dapat na >= 340 (400-60)
nalalabi
-aS alignment coverage para sa mas maikling sequence, default na 0.0 kung nakatakda sa 0.9, ang
Ang pagkakahanay ay dapat sumasakop sa 90% ng pagkakasunud-sunod
-AS alignment coverage control para sa mas maikling sequence, default na 99999999 kung nakatakda sa 60,
at ang haba ng sequence ay 400, kung gayon ang alignment ay dapat na >= 340 (400-60)
nalalabi
-B 1 o 0, default 0, bilang default, ang mga sequence ay naka-imbak sa RAM kung nakatakda sa 1, sequence
ay naka-imbak sa hard drive ito ay inirerekomenda na gamitin -B 1 para sa malalaking database
-g 1 o 0, default na 0 sa pamamagitan ng default na algorithm ng cd-hit, ang isang sequence ay naka-cluster sa
unang cluster na nakakatugon sa threshold (mabilis na cluster). Kung nakatakda sa 1, gagawin ng programa
i-cluster ito sa pinakakaparehong cluster na nakakatugon sa threshold (tumpak ngunit mabagal
mode) ngunit alinman sa 1 o 0 ay hindi magbabago sa mga kinatawan ng mga huling kumpol
-D max na laki bawat indel, default 1
-tugma tumutugmang marka, default 2
-mismatch
hindi tugmang marka, default -1
- gap marka ng pagbubukas ng gap, default -3
-gap-ext
marka ng extension ng gap, default -1
-bak magsulat ng backup na cluster file (1 o 0, default 0)
-h i-print ang tulong na ito
Mga tanong, bug, makipag-ugnayan kay Weizhong Li sa [protektado ng email]
Kung nakita mong kapaki-pakinabang ang cd-hit, mangyaring banggitin ang:
"Pag-cluster ng mga homologous na pagkakasunud-sunod upang bawasan ang laki ng malaking protina
database", Weizhong Li, Lukasz Jaroszewski at Adam Godzik. Bioinformatics, (2001)
17:282-283 "Cd-hit: isang mabilis na programa para sa clustering at paghahambing ng malalaking set ng
protina o nucleotide sequence", Weizhong Li & Adam Godzik. Bioinformatics, (2006)
22:1658-1659 "Beifang Niu, Limin Fu, Shulei Sun at Weizhong Li. Artipisyal at
natural na mga duplicate sa pyrosequencing reads ng metagenomic data. BMC Bioinformatics
(2010) 11:187 ng umaga
Gamitin ang cdhit-454 online gamit ang mga serbisyo ng onworks.net