Це команда formatdb, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS.
ПРОГРАМА:
ІМ'Я
formatdb - формат білкових або нуклеотидних баз даних для BLAST
СИНТАКСИС
formatdb [-] [-B ім'я файлу] [-F ім'я файлу] [-L ім'я файлу] [-T ім'я файлу] [-V] [-a] [-b] [-e]
[-i ім'я файлу] [-l ім'я файлу] [-n вул] [-o] [-p F] [-s] [-t вул] [-v N]
ОПИС
formatdb необхідно використовувати для форматування баз даних джерел білків або нуклеотидів
ці бази даних можна шукати за допомогою blastall, blastpgp або MegaBLAST. База даних джерела
може бути у форматі FASTA або ASN.1. Хоча формат FASTA найчастіше використовується як
вхід до formatdb, використання ASN.1 є вигідним для тих, хто використовує ASN.1 як
загальне джерело для інших форматів, таких як звіт GenBank. Один раз вихідний файл бази даних
було відформатовано за допомогою formatdb він не потрібен BLAST. Зверніть увагу, що якщо ви
буде застосовувати періодичні оновлення до ваших баз даних BLAST за допомогою fmerge(1), вам знадобиться
зберегти вихідний файл бази даних.
ВАРІАНТИ
Нижче наведено короткий опис варіантів.
- Роздрукувати повідомлення про використання
-B ім'я файлу
Двійковий файл Gifile створений із файлу Gifile, зазначеного в -F. Цей параметр визначає
ім'я файлу бінарного списку GI. Цей параметр слід використовувати з -F варіант. А
Текстовий список GI можна вказати за допомогою -F варіант і -B варіант вироблятиме
цей список GI у двійковому форматі. Двійковий файл менший і BLAST не потрібен
конвертувати його, щоб його можна було читати швидше.
-F ім'я файлу
Gifile (файл, що містить список gi) для використання з -B or -L
-L ім'я файлу
Створіть файл псевдоніма з ім ім'я файлу, обмежуючи шукані послідовності тими
визначено -F.
-T ім'я файлу
Встановіть ідентифікатори таксономії в ASN.1 deflines відповідно до таблиці в ім'я файлу.
-V Детально: перевірте наявність неунікальних ідентифікаторів рядків у базі даних
-a Вхідний файл є базою даних у форматі ASN.1 (інакше очікується FASTA)
-b База даних ASN.1 є двійковою (на відміну від тексту ASCII)
-e Вхід є записом Seq. Вихідна база даних ASN.1 (текстовий ascii або двійковий) може
містять набір Bioseq або лише один Bioseq. В останньому випадку -e слід надати.
-i ім'я файлу
Вхідні файли для форматування
-l ім'я файлу
Ім'я файлу журналу (за замовчуванням = formatdb.log)
-n вул Базове ім'я для файлів BLAST (за замовчуванням це назва оригінального файлу FASTA)
-o Проаналізуйте SeqID та створіть індекси. Якщо вихідна база даних у форматі FASTA, файл
ідентифікатори бази даних у рядку визначення FASTA повинні відповідати умовам
формат FASTA Defline.
-p F Вхідним є нуклеотид, а не білок.
-s Індексуйте лише за приєднанням, а не за локусом. Це особливо корисно для наборів послідовностей
як EST, де назви приєднання та локусу ідентичні. Formatdb запускається
швидше та створює менші тимчасові файли, якщо використовується цей параметр. Це сильно
рекомендовано для EST, STS, GSS та HTGS.
-t вул Назва файлу бази даних [рядок]
-v N Розбийте великі файли FASTA на «томи» розміру N мільйони листів (4000 тис
за замовчуванням). У рамках створення тому, formatdb пише новий тип BLAST
файл бази даних, який називається файлом псевдоніма, з розширенням `nal' або `pal'.
Використовуйте formatdb онлайн за допомогою служб onworks.net