To jest polecenie cdhit-454, które można uruchomić w bezpłatnym dostawcy hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
cd-hit-454 - szybko grupuj sekwencje, zoptymalizowane dla danych 454
STRESZCZENIE
CDhit-454 [Opcje]
OPIS
====== Wersja CD-HIT 4.6 (zbudowana 23 stycznia 2016 r.) ======
Opcje
-i wprowadź nazwę pliku w formacie fasta, wymagane
-o nazwa pliku wyjściowego, wymagana
-c próg identyczności sekwencji, domyślnie 0.98, jest to „globalna tożsamość sekwencji”
obliczane jako: liczba identycznych aminokwasów w ułożeniu podzielona przez całość
długość krótszej sekwencji + przerwy
-b szerokość pasma wyrównania, domyślnie 10
-M limit pamięci (w MB) dla programu, domyślnie 800; 0 dla nieograniczonych;
-T liczba wątków, domyślnie 1; z 0, wszystkie procesory będą używane
-n słowo_długość, domyślnie 10, zapoznaj się z podręcznikiem użytkownika, aby go wybrać
-glin pokrycie wyrównania dla dłuższej sekwencji, domyślnie 0.0, jeśli ustawione na 0.9,
wyrównanie musi obejmować 90% sekwencji
-GLIN kontrola pokrycia wyrównania dla dłuższej sekwencji, domyślnie 99999999 jeśli ustawione na 60,
a długość sekwencji wynosi 400, to dopasowanie musi być >= 340 (400-60)
pozostałości
-Jak pokrycie wyrównania dla krótszej sekwencji, domyślnie 0.0, jeśli ustawione na 0.9,
wyrównanie musi obejmować 90% sekwencji
-JAK kontrola pokrycia wyrównania dla krótszej sekwencji, domyślnie 99999999 przy ustawieniu na 60,
a długość sekwencji wynosi 400, to dopasowanie musi być >= 340 (400-60)
pozostałości
-B 1 lub 0, domyślnie 0, domyślnie sekwencje są przechowywane w pamięci RAM, jeśli ustawiono na 1, sekwencja
są przechowywane na dysku twardym, którego zaleca się używać -B 1 dla ogromnych baz danych
-g 1 lub 0, domyślnie 0 według domyślnego algorytmu cd-hit, sekwencja jest grupowana w
pierwszy klaster, który spełnia próg (szybki klaster). Jeśli ustawione na 1, program będzie
zgrupuj go w najbardziej podobny klaster, który spełnia próg (dokładny, ale wolny
mode), ale ani 1, ani 0 nie zmienią przedstawicieli klastrów końcowych
-D maksymalny rozmiar na indel, domyślnie 1
-mecz pasujący wynik, domyślny 2
-niedopasowanie
wynik niedopasowany, domyślnie -1
-Luka wynik otwarcia luki, domyślny -3
-gap-ext
wynik rozszerzenia luki, domyślny -1
-Bak zapisz plik klastra kopii zapasowej (1 lub 0, domyślnie 0)
-h wydrukuj tę pomoc
Pytania, błędy, skontaktuj się z Weizhong Li at [email chroniony]
Jeśli uważasz, że cd-hit jest przydatne, uprzejmie zacytuj:
„Grupowanie wysoce homologicznych sekwencji w celu zmniejszenia rozmiaru dużych białek
baza danych", Weizhong Li, Łukasz Jaroszewski i Adam Godzik. Bioinformatyka, (2001)
17:282-283 „Cd-hit: szybki program do grupowania i porównywania dużych zestawów
sekwencje białek lub nukleotydów”, Weizhong Li i Adam Godzik. Bioinformatyka, (2006)
22:1658-1659 „Beifang Niu, Limin Fu, Shulei Sun i Weizhong Li. Sztuczne i
naturalne duplikaty w odczytach pirosekwencjonowania danych metagenomicznych. BMC Bioinformatyka
(2010) 11: 187
Użyj cdhit-454 online, korzystając z usług onworks.net