Це команда cdhit-454, яку можна запустити у безкоштовного хостинг-провайдера OnWorks за допомогою однієї з наших безкоштовних онлайн-робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS
ПРОГРАМА:
ІМ'Я
cd-hit-454 - швидко групує послідовності, оптимізовані для 454 даних
СИНТАКСИС
cdhit-454 [Опції]
ОПИС
====== CD-HIT версія 4.6 (зроблено 23 січня 2016) ======
Опції
-i введіть назву файлу у форматі fasta, обов'язково
-o ім'я вихідного файлу, обов'язкове
-c порогове значення ідентичності послідовності, за замовчуванням 0.98 це "глобальна ідентичність послідовності"
розраховується як: кількість ідентичних амінокислот у вирівнюванні поділена на повну
довжина коротшої послідовності + пропуски
-b band_width вирівнювання, за замовчуванням 10
-M ліміт пам’яті (у МБ) для програми, за замовчуванням 800; 0 для необмежених;
-T кількість потоків, за замовчуванням 1; з 0 будуть використовуватися всі процесори
-n word_length, за замовчуванням 10, див. посібник користувача щодо його вибору
-aL покриття вирівнювання для довшої послідовності, за замовчуванням 0.0, якщо встановлено значення 0.9, the
вирівнювання має охоплювати 90% послідовності
-АЛ керування покриттям вирівнювання для довшої послідовності, за замовчуванням 99999999, якщо встановлено значення 60,
і довжина послідовності 400, тоді вирівнювання має бути >= 340 (400-60)
залишки
-aS покриття вирівнювання для коротшої послідовності, за замовчуванням 0.0, якщо встановлено значення 0.9, the
вирівнювання має охоплювати 90% послідовності
-АС керування покриттям вирівнювання для коротшої послідовності, за замовчуванням 99999999, якщо встановлено значення 60,
і довжина послідовності 400, тоді вирівнювання має бути >= 340 (400-60)
залишки
-B 1 або 0, за замовчуванням 0, за замовчуванням послідовності зберігаються в RAM, якщо встановлено значення 1, послідовність
зберігаються на жорсткому диску, рекомендовано використовувати -B 1 для величезних баз даних
-g 1 або 0, за замовчуванням 0 за стандартним алгоритмом cd-hit, послідовність групується до
перший кластер, який відповідає порогу (швидкий кластер). Якщо встановлено значення 1, програма буде
об’єднайте його в найбільш подібний кластер, який відповідає порогу (точний, але повільний
режим), але 1 або 0 не змінить представників кінцевих кластерів
-D максимальний розмір на індель, за замовчуванням 1
- матч збігається оцінка, за замовчуванням 2
- невідповідність
невідповідність оцінки, за замовчуванням -1
- розрив Оцінка відкриття розриву, за замовчуванням -3
-розрив-вн
оцінка розширення розриву, за умовчанням -1
-бак записати файл кластера резервної копії (1 або 0, за замовчуванням 0)
-h роздрукувати цю довідку
Питання, помилки, зв’яжіться з Вейчжуном Лі за адресою [захищено електронною поштою]
Якщо ви вважаєте CD-hit корисним, будь ласка, процитуйте:
«Кластеризація високогомологічних послідовностей для зменшення розміру великого білка
база даних», Вейчжун Лі, Лукаш Ярошевський та Адам Годзик. Біоінформатика, (2001)
17:282-283 «Cd-hit: швидка програма для кластеризації та порівняння великих наборів
білкові або нуклеотидні послідовності», Вейчжун Лі та Адам Годзік. Біоінформатика, (2006)
22:1658-1659 "Бейфан Ніу, Лімін Фу, Шулей Сунь і Вейчжун Лі. Штучні та
природні дублікати в піросеквенуванні зчитування метагеномних даних. Біоінформатика BMC
(2010) 11: 187
Використовуйте cdhit-454 онлайн за допомогою сервісів onworks.net