Dies ist der Befehl cdhit-454, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
cd-hit-454 – schnelle Gruppensequenzen, optimiert für 454-Daten
ZUSAMMENFASSUNG
cdhit-454 [Optionen]
BESCHREIBUNG
====== CD-HIT Version 4.6 (erstellt am 23) ======
Optionen
-i Dateinamen im Fasta-Format eingeben, erforderlich
-o Ausgabedateiname, erforderlich
-c Schwellenwert für Sequenzidentität, Standardwert 0.98 Dies ist eine „globale Sequenzidentität“.
berechnet als: Anzahl identischer Aminosäuren in Ausrichtung dividiert durch die Gesamtzahl
Länge der kürzeren Sequenz + Lücken
-b band_width der Ausrichtung, Standard 10
-M Speicherlimit (in MB) für das Programm, Standard 800; 0 für unbegrenzt;
-T Anzahl Threads, Standard 1; mit 0 werden alle CPUs verwendet
-n word_length, Standardwert 10, siehe Benutzerhandbuch für die Auswahl
-al Alignment-Coverage für die längere Sequenz, Standardwert 0.0, wenn auf 0.9 gesetzt, die
Das Alignment muss 90% der Sequenz abdecken
-AL Ausrichtungsabdeckungssteuerung für die längere Sequenz, Standard 99999999, wenn auf 60 gesetzt,
und die Länge der Sequenz 400 beträgt, dann muss das Alignment >= 340 (400-60) sein
Rückstände
-wie Alignment Coverage für die kürzere Sequenz, Standard 0.0, wenn auf 0.9 gesetzt, die
Das Alignment muss 90% der Sequenz abdecken
-WIE Ausrichtungsabdeckungssteuerung für die kürzere Sequenz, Standard 99999999, wenn auf 60 gesetzt,
und die Länge der Sequenz 400 beträgt, dann muss das Alignment >= 340 (400-60) sein
Rückstände
-B 1 oder 0, Standard 0, Standardmäßig werden Sequenzen im RAM gespeichert, wenn auf 1 gesetzt, Sequenz
auf der Festplatte gespeichert sind, wird empfohlen zu verwenden -B 1 für riesige Datenbanken
-g 1 oder 0, Standardwert 0 durch den Standardalgorithmus von cd-hit, eine Sequenz wird zu den
ersten Cluster, der den Schwellenwert erfüllt (schneller Cluster). Bei Einstellung auf 1 wird das Programm
gruppieren Sie es in den ähnlichsten Cluster, der den Schwellenwert erfüllt (genau, aber langsam
Modus), aber entweder 1 oder 0 ändert die Repräsentanten der endgültigen Cluster nicht
-D Maximale Größe pro Indel, Standard 1
-Spiel Matching-Score, Standard 2
-Nichtübereinstimmung
Nicht übereinstimmende Punktzahl, Standard -1
-Lücke Lückenöffnungsergebnis, Standard -3
-gap-ext
Gap Extension Score, Standard -1
-backen Backup-Cluster-Datei schreiben (1 oder 0, Standard 0)
-h diese Hilfe ausdrucken
Bei Fragen, Fehlern wenden Sie sich bitte an Weizhong Li unter [E-Mail geschützt]
Wenn Sie CD-Hit nützlich finden, zitieren Sie bitte:
"Clustering von hochhomologen Sequenzen, um die Größe großer Proteine zu reduzieren
Datenbank", Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Bioinformatik, (2001)
17:282-283 „Cd-hit: ein schnelles Programm zum Clustering und Vergleichen großer Mengen von
Protein- oder Nukleotidsequenzen“, Weizhong Li & Adam Godzik. Bioinformatik, (2006)
22:1658-1659 „Beifang Niu, Limin Fu, Shulei Sun und Weizhong Li. Künstliche und
natürliche Duplikate bei Pyrosequenzierungs-Lesevorgängen metagenomischer Daten. BMC Bioinformatik
(2010) 11: 187
Verwenden Sie cdhit-454 online über die Dienste von onworks.net