cdhit-454 - Интернет в облаке

Это команда cdhit-454, которую можно запустить в провайдере бесплатного хостинга OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


cd-hit-454 - быстрая группировка последовательностей, оптимизированная для 454 данных

СИНТАКСИС


cdhit-454 [Опции]

ОПИСАНИЕ


====== CD-HIT версии 4.6 (от 23 января 2016 г.) ======

Опции

-i введите имя файла в формате fasta, обязательно

-o имя выходного файла, обязательно

-c порог идентичности последовательности, по умолчанию 0.98, это «глобальная идентичность последовательности»
рассчитывается как: количество идентичных аминокислот в выравнивании, деленное на полное
длина более короткой последовательности + пробелы

-b band_width of alignment, по умолчанию 10

-M ограничение памяти (в МБ) для программы, по умолчанию 800; 0 для неограниченного;

-T количество потоков, по умолчанию 1; с 0 будут использоваться все процессоры

-n word_length, по умолчанию 10, см. руководство пользователя для выбора

-аЛ охват выравнивания для более длинной последовательности, по умолчанию 0.0, если установлено значение 0.9,
выравнивание должно охватывать 90% последовательности

-АЛ контроль покрытия выравнивания для более длинной последовательности, по умолчанию 99999999, если установлено значение 60,
и длина последовательности 400, тогда выравнивание должно быть> = 340 (400-60)
остатки

-в качестве охват выравнивания для более короткой последовательности, по умолчанию 0.0, если установлено значение 0.9,
выравнивание должно охватывать 90% последовательности

-В КАЧЕСТВЕ контроль покрытия выравнивания для более короткой последовательности, по умолчанию 99999999, если установлено значение 60,
и длина последовательности 400, тогда выравнивание должно быть> = 340 (400-60)
остатки

-B 1 или 0, по умолчанию 0, по умолчанию последовательности сохраняются в ОЗУ, если установлено 1, последовательность
хранятся на жестком диске, рекомендуется использовать -B 1 для огромных баз данных

-g 1 или 0, по умолчанию 0 алгоритмом по умолчанию cd-hit, последовательность кластеризуется в
первый кластер, соответствующий порогу (быстрый кластер). Если установлено значение 1, программа будет
сгруппируйте его в наиболее похожий кластер, который соответствует пороговому значению (точный, но медленный
mode), но ни 1, ни 0 не изменят представителей конечных кластеров

-D максимальный размер на отступ, по умолчанию 1

-соответствие оценка соответствия, по умолчанию 2

-несоответствие
оценка несовпадения, по умолчанию -1

-зазор начальный счет разрыва, по умолчанию -3

-пробел-ext
оценка расширения разрыва, по умолчанию -1

-бак записать файл резервной копии кластера (1 или 0, по умолчанию 0)

-h распечатать эту справку

Вопросы, ошибки, свяжитесь с Weizhong Li по адресу liwz@sdsc.edu

Если вы сочтете компакт-диск полезным, пожалуйста, процитируйте:

"Кластеризация высокогомологичных последовательностей для уменьшения размера большого белка
база данных », Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Bioinformatics, (2001)
17: 282-283 "Cd-hit: быстрая программа для кластеризации и сравнения больших наборов
белковые или нуклеотидные последовательности », Weizhong Li & Adam Godzik. Bioinformatics, (2006)
22: 1658-1659 "Бэйфан Ню, Лимин Фу, Шулей Сун и Вэйчжун Ли. Искусственные и
естественные дубликаты при пиросеквенировании считываний метагеномных данных. BMC Bioinformatics
(2010) 11: 187

Используйте cdhit-454 онлайн с помощью сервисов onworks.net



Новейшие онлайн-программы для Linux и Windows