EngelsFransSpaans

Ad


OnWorks-favicon

cdhit-est-2d - Online in de cloud

Voer cdhit-est-2d uit in de gratis hostingprovider van OnWorks via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht cdhit-est-2d die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


cdhit-est-2d - voer het CD-HIT-algoritme uit op RNA/DNA-sequenties in db1- of db2-indeling

KORTE INHOUD


cdhit-est-2d [Opties]

PRODUCTBESCHRIJVING


====== CD-HIT versie 4.6 (gebouwd op 23 jan. 2016) ======

Opties

-i invoerbestandsnaam voor db1 in fasta-indeling, vereist

-i2 invoerbestandsnaam voor db2 in fasta-indeling, vereist

-o output bestandsnaam, verplicht

-c sequentie-identiteitsdrempel, standaard 0.9 dit is de standaard cd-hit's "global
sequentie-identiteit" berekend als: aantal identieke aminozuren in uitlijning
gedeeld door de volledige lengte van de kortere reeks

-G gebruik globale sequentie-identiteit, standaard 1 indien ingesteld op 0, gebruik dan lokale sequentie
identiteit, berekend als: aantal identieke aminozuren in uitlijning gedeeld door
de lengte van de uitlijning LET OP!!! niet gebruiken -G 0 tenzij u uitlijning gebruikt
dekking controles zie opties -al, -AL, -als, -ALS

-b bandbreedte van uitlijning, standaard 20

-M geheugenlimiet (in MB) voor het programma, standaard 800; 0 voor onbeperkt;

-T aantal threads, standaard 1; bij 0 worden alle CPU's gebruikt

-n word_length, standaard 10, zie de gebruikershandleiding om dit te kiezen

-l lengte van throw_away_sequences, standaard 10

-d lengte van beschrijving in .clstr-bestand, standaard 20 indien ingesteld op 0, neemt de fasta
defline en stopt bij het eerste veld

-s cutoff lengteverschil, standaard 0.0 indien ingesteld op 0.9, de kortere sequenties moeten
ten minste 90% van de lengte van de vertegenwoordiger van het cluster zijn

-S cutoff lengteverschil in aminozuur, standaard 999999 indien ingesteld op 60, de lengte
verschil tussen de kortere reeksen en de vertegenwoordiger van het cluster kan
niet groter zijn dan 60

-s2 lengteverschilgrens voor db1, standaard 1.0 standaard, seqs in db1 >= seqs in
db2 in hetzelfde cluster, indien ingesteld op 0.9, kan seqs in db1 slechts >= 90% seqs in db2 zijn

-S2 afsnijding lengteverschil, standaard standaard 0, seqs in db1 >= seqs in db2 in a
hetzelfde cluster indien ingesteld op 60, seqs in db2 kunnen 60aa langer zijn dan seqs in db1

-al uitlijningsdekking voor de langere reeks, standaard 0.0 indien ingesteld op 0.9, de
uitlijning moet 90% van de reeks beslaan

-AL uitlijningsdekkingsregeling voor de langere reeks, standaard 99999999 indien ingesteld op 60,
en de lengte van de reeks is 400, dan moet de uitlijning >= 340 (400-60) zijn
residuen

-als uitlijningsdekking voor de kortere reeks, standaard 0.0 indien ingesteld op 0.9, de
uitlijning moet 90% van de reeks beslaan

-ALS uitlijningsdekkingsregeling voor de kortere reeks, standaard 99999999 indien ingesteld op 60,
en de lengte van de reeks is 400, dan moet de uitlijning >= 340 (400-60) zijn
residuen

-A minimale dekkingscontrole voor uitlijning voor beide sequenties, standaard 0 uitlijning moet
dekking >= deze waarde voor beide sequenties

-ul maximaal ongeëvenaard percentage voor de langere reeks, standaard 1.0 indien ingesteld op 0.1,
de ongeëvenaarde regio (exclusief voorloop- en staartkloof) mag niet meer zijn dan 10%
van de reeks

-ons maximaal ongeëvenaard percentage voor de kortere reeks, standaard 1.0 indien ingesteld op 0.1,
de ongeëvenaarde regio (exclusief voorloop- en staartkloof) mag niet meer zijn dan 10%
van de reeks

-U maximale ongeëvenaarde lengte, standaard 99999999 indien ingesteld op 10, de ongeëvenaarde regio
(exclusief voorloop- en staartopeningen) mag niet meer dan 10 basen zijn

-B 1 of 0, standaard 0, reeksen worden standaard opgeslagen in RAM indien ingesteld op 1, reeks
zijn opgeslagen op de harde schijf wordt aanbevolen om te gebruiken -B 1 voor enorme databases

-p 1 of 0, standaard 0 indien ingesteld op 1, overlapping van afdrukuitlijning in .clstr-bestand

-g 1 of 0, standaard 0 volgens het standaardalgoritme van cd-hit, wordt een reeks geclusterd naar de
eerste cluster dat aan de drempel voldoet (snelle cluster). Indien ingesteld op 1, zal het programma
cluster het in het meest vergelijkbare cluster dat aan de drempel voldoet (nauwkeurig maar langzaam
modus) maar 1 of 0 zal de vertegenwoordigers van de uiteindelijke clusters niet veranderen

-r 1 of 0, standaard 1, standaard zowel +/+ als +/- uitlijningen indien ingesteld op 0, alleen +/+
uitlijning van strengen

-masker maskerende letters (bijv -masker NX, om zowel 'N' als 'X' te maskeren)

-bij elkaar passen overeenkomende score, standaard 2 (1 voor TU en NN)

-mismatch
niet-overeenkomende score, standaard -2

-gat openingsscore, standaard -6

-gap-ext
gap-extensiescore, standaard -1

-bak back-up clusterbestand schrijven (1 of 0, standaard 0)

-h print deze hulp

Vragen, bugs, neem contact op met Limin Fu via [e-mail beveiligd], of Weizhong Li op [e-mail beveiligd]
Ga voor bijgewerkte versies en informatie naar: http://cd-hit.org

cd-hit webserver is ook beschikbaar vanaf http://cd-hit.org

Als u cd-hit nuttig vindt, vermeld dan alstublieft:

"Clustering van zeer homologe sequenties om de grootte van grote eiwitten te verminderen
database", Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Bio-informatica, (2001)
17:282-283 "Cd-hit: een snel programma voor het clusteren en vergelijken van grote sets
eiwit- of nucleotidesequenties", Weizhong Li & Adam Godzik. Bioinformatica, (2006)
22: 1658-1659

Gebruik cdhit-est-2d online met behulp van onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

Linux-commando's

Ad