InglesPransesEspanyol

Ad


OnWorks favicon

cdhit-2d - Online sa Cloud

Patakbuhin ang cdhit-2d sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command na cdhit-2d na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


cdhit-2d - mabilis na mga pagkakasunud-sunod ng pangkat sa db1 o db2 na format

SINOPSIS


cdhit-2d [Options]

DESCRIPTION


====== CD-HIT na bersyon 4.6 (itinayo noong Ene 23 2016) ======

Options

-i input filename para sa db1 sa fasta format, kinakailangan

-i2 input filename para sa db2 sa fasta format, kinakailangan

-o output filename, kinakailangan

-c sequence identity threshold, default 0.9 ito ang default na cd-hit na "global
pagkakakilanlan ng pagkakasunud-sunod" na kinakalkula bilang: bilang ng magkaparehong mga amino acid sa pagkakahanay
hinati sa buong haba ng mas maikling sequence

-G gumamit ng global sequence identity, default 1 kung nakatakda sa 0, pagkatapos ay gumamit ng local sequence
pagkakakilanlan, kinalkula bilang : bilang ng magkakahawig na mga amino acid sa pagkakahanay na hinati sa
ang haba ng alignment NOTE!!! huwag gumamit -G 0 maliban kung gagamit ka ng alignment
tingnan ng mga kontrol sa saklaw ang mga opsyon -aL, -AL, -aS, -AS

-b band_width ng alignment, default 20

-M limitasyon ng memorya (sa MB) para sa programa, default na 800; 0 para sa walang limitasyon;

-T bilang ng mga thread, default 1; na may 0, lahat ng mga CPU ay gagamitin

-n word_length, default 5, tingnan ang gabay ng gumagamit para sa pagpili nito

-l haba ng throw_away_sequences, default 10

-t tolerance para sa redundance, default 2

-d haba ng paglalarawan sa .clstr file, ang default ay 20 kung nakatakda sa 0, ito ay tumatagal ng mabilis
defline at huminto sa unang espasyo

-s cutoff ng pagkakaiba sa haba, default na 0.0 kung itinakda sa 0.9, kailangan ng mas maiikling pagkakasunud-sunod
hindi bababa sa 90% ang haba ng kinatawan ng cluster

-S haba ng pagkakaiba cutoff sa amino acid, default 999999 kung nakatakda sa 60, ang haba
pagkakaiba sa pagitan ng mas maikling mga pagkakasunud-sunod at ang kinatawan ng cluster ay maaaring
hindi hihigit sa 60

-s2 cutoff ng pagkakaiba sa haba para sa db1, default na 1.0 bilang default, seqs sa db1 >= seqs sa
db2 sa parehong cluster kung nakatakda sa 0.9, ang mga seq sa db1 ay maaaring >= 90% lang sa db2

-S2 cutoff ng pagkakaiba sa haba, default 0 bilang default, seqs sa db1 >= seqs sa db2 sa isang
parehong cluster kung itinakda sa 60, ang mga seq sa db2 ay maaaring 60aa na mas mahaba kaysa sa mga seq sa db1

-aL alignment coverage para sa mas mahabang sequence, default na 0.0 kung nakatakda sa 0.9, ang
Ang pagkakahanay ay dapat sumasakop sa 90% ng pagkakasunud-sunod

-AL alignment coverage control para sa mas mahabang sequence, default na 99999999 kung nakatakda sa 60,
at ang haba ng sequence ay 400, kung gayon ang alignment ay dapat na >= 340 (400-60)
nalalabi

-aS alignment coverage para sa mas maikling sequence, default na 0.0 kung nakatakda sa 0.9, ang
Ang pagkakahanay ay dapat sumasakop sa 90% ng pagkakasunud-sunod

-AS alignment coverage control para sa mas maikling sequence, default na 99999999 kung nakatakda sa 60,
at ang haba ng sequence ay 400, kung gayon ang alignment ay dapat na >= 340 (400-60)
nalalabi

-A minimal alignment coverage control para sa parehong sequence, default 0 alignment dapat
cover >= ang value na ito para sa parehong sequence

-uL maximum na hindi tugmang porsyento para sa mas mahabang sequence, default na 1.0 kung nakatakda sa 0.1,
ang walang kaparis na rehiyon (hindi kasama ang mga nangunguna at tailing gaps) ay hindi dapat higit sa 10%
ng pagkakasunod-sunod

-uS maximum na hindi tugmang porsyento para sa mas maikling sequence, default na 1.0 kung nakatakda sa 0.1,
ang walang kaparis na rehiyon (hindi kasama ang mga nangunguna at tailing gaps) ay hindi dapat higit sa 10%
ng pagkakasunod-sunod

-U maximum na hindi katugmang haba, default na 99999999 kung nakatakda sa 10, ang hindi katugmang rehiyon
(hindi kasama ang leading at tailing gaps) ay hindi dapat higit sa 10 base

-B 1 o 0, default 0, bilang default, ang mga sequence ay naka-imbak sa RAM kung nakatakda sa 1, sequence
ay naka-imbak sa hard drive ito ay inirerekomenda na gamitin -B 1 para sa malalaking database

-p 1 o 0, default na 0 kung nakatakda sa 1, magkakapatong ang pagkakahanay ng pag-print sa .clstr file

-g 1 o 0, default na 0 sa pamamagitan ng default na algorithm ng cd-hit, ang isang sequence ay naka-cluster sa
unang cluster na nakakatugon sa threshold (mabilis na cluster). Kung nakatakda sa 1, gagawin ng programa
i-cluster ito sa pinakakaparehong cluster na nakakatugon sa threshold (tumpak ngunit mabagal
mode) ngunit alinman sa 1 o 0 ay hindi magbabago sa mga kinatawan ng mga huling kumpol

-bak magsulat ng backup na cluster file (1 o 0, default 0)

-h i-print ang tulong na ito

Mga tanong, bug, makipag-ugnayan kay Weizhong Li sa [protektado ng email]

Kung nakita mong kapaki-pakinabang ang cd-hit, mangyaring banggitin ang:

"Pag-cluster ng mga homologous na pagkakasunud-sunod upang bawasan ang laki ng malaking protina
database", Weizhong Li, Lukasz Jaroszewski at Adam Godzik. Bioinformatics, (2001)
17:282-283 "Cd-hit: isang mabilis na programa para sa clustering at paghahambing ng malalaking set ng
protina o nucleotide sequence", Weizhong Li & Adam Godzik. Bioinformatics, (2006)
22: 1658 1659-

Gumamit ng cdhit-2d online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

Linux command

Ad