Dit is de opdracht cdhit-454 die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator
PROGRAMMA:
NAAM
cd-hit-454 - snel groepeer sequenties, geoptimaliseerd voor 454 data
KORTE INHOUD
cdhit-454 [Opties]
PRODUCTBESCHRIJVING
====== CD-HIT versie 4.6 (gebouwd op 23 jan. 2016) ======
Opties
-i invoer bestandsnaam in fasta-indeling, vereist
-o output bestandsnaam, verplicht
-c drempelwaarde voor sequentie-identiteit, standaard 0.98 dit is een "algemene sequentie-identiteit"
berekend als: aantal identieke aminozuren in uitlijning gedeeld door de volledige
lengte van de kortere reeks + hiaten
-b bandbreedte van uitlijning, standaard 10
-M geheugenlimiet (in MB) voor het programma, standaard 800; 0 voor onbeperkt;
-T aantal threads, standaard 1; bij 0 worden alle CPU's gebruikt
-n word_length, standaard 10, zie de gebruikershandleiding om dit te kiezen
-al uitlijningsdekking voor de langere reeks, standaard 0.0 indien ingesteld op 0.9, de
uitlijning moet 90% van de reeks beslaan
-AL uitlijningsdekkingsregeling voor de langere reeks, standaard 99999999 indien ingesteld op 60,
en de lengte van de reeks is 400, dan moet de uitlijning >= 340 (400-60) zijn
residuen
-als uitlijningsdekking voor de kortere reeks, standaard 0.0 indien ingesteld op 0.9, de
uitlijning moet 90% van de reeks beslaan
-ALS uitlijningsdekkingsregeling voor de kortere reeks, standaard 99999999 indien ingesteld op 60,
en de lengte van de reeks is 400, dan moet de uitlijning >= 340 (400-60) zijn
residuen
-B 1 of 0, standaard 0, reeksen worden standaard opgeslagen in RAM indien ingesteld op 1, reeks
zijn opgeslagen op de harde schijf wordt aanbevolen om te gebruiken -B 1 voor enorme databases
-g 1 of 0, standaard 0 volgens het standaardalgoritme van cd-hit, wordt een reeks geclusterd naar de
eerste cluster dat aan de drempel voldoet (snelle cluster). Indien ingesteld op 1, zal het programma
cluster het in het meest vergelijkbare cluster dat aan de drempel voldoet (nauwkeurig maar langzaam
modus) maar 1 of 0 zal de vertegenwoordigers van de uiteindelijke clusters niet veranderen
-D maximale grootte per indel, standaard 1
-bij elkaar passen overeenkomende score, standaard 2
-mismatch
niet-overeenkomende score, standaard -1
-gat openingsscore, standaard -3
-gap-ext
gap-extensiescore, standaard -1
-bak back-up clusterbestand schrijven (1 of 0, standaard 0)
-h print deze hulp
Vragen, bugs, neem contact op met Weizhong Li op [e-mail beveiligd]
Als u cd-hit nuttig vindt, vermeld dan alstublieft:
"Clustering van zeer homologe sequenties om de grootte van grote eiwitten te verminderen
database", Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Bio-informatica, (2001)
17:282-283 "Cd-hit: een snel programma voor het clusteren en vergelijken van grote sets
eiwit- of nucleotidesequenties", Weizhong Li & Adam Godzik. Bioinformatica, (2006)
22: 1658-1659 "Beifang Niu, Limin Fu, Shulei Sun en Weizhong Li. Kunstmatig en
natuurlijke duplicaten bij pyrosequencing-lezingen van metagenomische gegevens. BMC Bio-informatica
(2010) 11 uur
Gebruik cdhit-454 online met behulp van onworks.net-services