Aceasta este comanda cdhit-454 care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
cd-hit-454 - grupează rapid secvențe, optimizate pentru 454 de date
REZUMAT
cdhit-454 [Opţiuni]
DESCRIERE
====== CD-HIT versiunea 4.6 (construită pe 23 ianuarie 2016) ======
Opţiuni
-i introduceți numele fișierului în format fasta, necesar
-o numele fișierului de ieșire, necesar
-c pragul de identitate a secvenței, implicit 0.98 aceasta este o „identitate a secvenței globale”
calculat ca: numărul de aminoacizi identici în aliniere împărțit la total
lungimea secvenței mai scurte + goluri
-b band_width of alignment, implicit 10
-M limita de memorie (în MB) pentru program, implicit 800; 0 pentru nelimitat;
-T numărul de fire, implicit 1; cu 0, vor fi folosite toate procesoarele
-n word_length, implicit 10, consultați ghidul utilizatorului pentru a-l alege
-aL acoperire de aliniere pentru secvența mai lungă, implicit 0.0 dacă este setată la 0.9,
alinierea trebuie să acopere 90% din secvență
-AL controlul acoperirii alinierii pentru secvența mai lungă, implicit 99999999 dacă este setat la 60,
iar lungimea secvenței este 400, atunci alinierea trebuie să fie >= 340 (400-60)
reziduuri
-la fel de acoperire de aliniere pentru secvența mai scurtă, implicit 0.0 dacă este setată la 0.9,
alinierea trebuie să acopere 90% din secvență
-LA FEL DE controlul acoperirii alinierii pentru secvența mai scurtă, implicit 99999999 dacă este setat la 60,
iar lungimea secvenței este 400, atunci alinierea trebuie să fie >= 340 (400-60)
reziduuri
-B 1 sau 0, implicit 0, în mod implicit, secvențele sunt stocate în RAM dacă sunt setate la 1, secvența
sunt stocate pe hard disk, se recomandă utilizarea -B 1 pentru baze de date uriașe
-g 1 sau 0, implicit 0 prin algoritmul implicit al cd-hit, o secvență este grupată la
primul cluster care îndeplinește pragul (cluster rapid). Dacă este setat la 1, programul va
grupați-l în cel mai asemănător cluster care îndeplinește pragul (precise, dar lent
mod), dar fie 1, fie 0 nu vor schimba reprezentanții clusterelor finale
-D dimensiune maximă per indel, implicit 1
-Meci scor de potrivire, implicit 2
- nepotrivire
scor nepotrivire, implicit -1
-decalaj scorul deschiderii decalajului, implicit -3
-gap-ext
scorul extensiei decalajului, implicit -1
-cos scrieți fișierul cluster de rezervă (1 sau 0, implicit 0)
-h imprimați acest ajutor
Întrebări, erori, contactați Weizhong Li la [e-mail protejat]
Dacă găsiți cd-hit util, vă rugăm să citați:
„Clustering de secvențe extrem de omoloage pentru a reduce dimensiunea proteinelor mari
baza de date", Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Bioinformatica, (2001)
17:282-283 „Cd-hit: un program rapid pentru gruparea și compararea seturilor mari de
proteine sau secvențe de nucleotide", Weizhong Li & Adam Godzik. Bioinformatică, (2006)
22:1658-1659 „Beifang Niu, Limin Fu, Shulei Sun și Weizhong Li. Artificial și
duplicate naturale în citirile de pirosecvențiere ale datelor metagenomice. BMC Bioinformatica
(2010) 11:187
Utilizați cdhit-454 online folosind serviciile onworks.net