jackhmmer - онлайн в хмарі

Це команда jackhmmer, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

ПРОГРАМА:

ІМ'Я


jackhmmer - ітераційний пошук послідовності(ів) у базі даних білків

СИНТАКСИС


Jackhmmer [параметри]

ОПИС


Jackhmmer ітеративно шукає кожну послідовність запитів проти цілі
послідовність(и) в . Перша ітерація ідентична a phmmer пошук. Для
наступна ітерація, множинне вирівнювання запиту разом з усіма цільовими послідовностями
задовільний включення пороги збирається, з цього вирівнювання будується профіль
(ідентичний використанню hmmbuild на вирівнюванні), а також пошук профілю зроблено
(ідентичний ан хм, пошук з профілем).

Запит може бути '-' (символ тире), у цьому випадку послідовності запиту є
читати з а pipe замість файлу. The не можна прочитати з a
потік, тому що Jackhmmer необхідно зробити кілька проходів по базі даних.

Формат виводу розроблений так, щоб його можна було читати людиною, але часто настільки об’ємний, що
читати його недоцільно, а розбирати це боляче. The --tblout та --domtblout опції
зберегти вихід у простих табличних форматах, які є стислими та легшими для аналізу. The -o варіант
дозволяє перенаправляти основний вихід, у тому числі викидати його в /dev/null.

ВАРІАНТИ


-h Допомога; надрукувати коротке нагадування про використання командного рядка та всі доступні параметри.

-N Встановіть максимальну кількість ітерацій на . За замовчуванням 5. Якщо N=1, результат
еквівалентно phmmer пошук.

ВАРІАНТИ КОНТРОЛЬ ВИХІД


За замовчуванням вихід для кожної ітерації з'являється на стандартному виводі в дещо зрозумілому для людини,
дещо розбірливий формат. Ці параметри дозволяють перенаправити цей вихід або зберегти
додаткові види виводу до файлів, включаючи файли контрольних точок для кожної ітерації.

-o Спрямуйте читабельний вихід у файл .

-A Після останньої ітерації збережіть множинне вирівнювання з коментарями для всіх звернень
задовольняють порогові значення включення (також включаючи вихідний запит). in
Стокгольмський формат.

--tblout
Після останньої ітерації збережіть табличний підсумок звернень у верхній послідовності В
легко розбірливий, стовпчастий формат із роздільниками пробілів.

--domtblout
Після останньої ітерації збережіть табличний підсумок звернень у верхній домен В
легко розбірливий, стовпчастий формат із роздільниками пробілів.

--чхмм
На початку кожної ітерації перевіряйте запит HMM, зберігаючи його у файлі з іменем
- .хмм де – номер ітерації (від 1..N).

--чкалі
Наприкінці кожної ітерації поставте контрольну точку вирівнювання всіх доменів, які задовольняють
пороги включення (наприклад, що стане запитом HMM для наступної ітерації),
збереження його у файл з іменем <контрольна точка файл префікс>- .sto у стокгольмському форматі,
де – номер ітерації (від 1..N).

--згідно Використовуйте приєднання замість імен у головному виводі, якщо доступно для профілів
та/або послідовності.

--ноалі
Пропустіть розділ вирівнювання з основного виводу. Це може значно знизити вихід
обсяг.

--notextw
Не обмежуйте довжину кожного рядка в основному виводі. За замовчуванням встановлено обмеження в 120
символів на рядок, що допомагає чітко відображати результат на терміналах і
у редакторах, але може обрізати рядки опису цільового профілю.

--textw
Встановіть обмеження довжини рядка основного виводу на символів на рядок. За замовчуванням є
120.

ВАРІАНТИ КОНТРОЛЬ SINGLE ПОСЛІДОВНІСТЬ БАЛЮВАННЯ (СПОЧАТКУ ІТЕРАЦІЯ)


За замовчуванням перша ітерація використовує модель пошуку, створену з одного запиту
послідовність. Ця модель побудована з використанням стандартної матриці заміщення залишку розміром 20x20
ймовірності та два додаткові параметри для незалежних від позиції розриву та розриву
розширити ймовірності. Ці параметри дозволяють використовувати параметри оцінки за замовчуванням для однієї послідовності
бути зміненим.

--відкрий
Встановіть ймовірність відкриття розриву для моделі запиту з однією послідовності . За замовчуванням
є 0.02. має бути >= 0 і < 0.5.

--розтягнути
Встановіть ймовірність розширення розриву для моделі запиту з однією послідовністю ,
за замовчуванням - 0.4. має бути >= 0 і < 1.0.

--mx
Отримайте ймовірності вирівнювання залишків із вбудованої матриці підстановки з іменем
. Кілька стандартних матриць вбудовані, і їх не потрібно зчитувати
файлів. Назва матриці може бути PAM30, PAM70, PAM120, PAM240, BLOSUM45,
BLOSUM50, BLOSUM62, BLOSUM80 або BLOSUM90. Лише один із --mx та --mxfile
можна використовувати варіанти.

--mxfile
Отримайте ймовірності вирівнювання залишків із матриці підстановки у файлі
. Матриця оцінок за замовчуванням — BLOSUM62 (ця матриця є внутрішньою для HMMER
і не повинен бути доступним у вигляді файлу). Формат матриці підстановки
є стандартним форматом, прийнятим для BLAST, FASTA та іншої послідовності
програмне забезпечення для аналізу.

ВАРІАНТИ КОНТРОЛЬ ЗВІТНІСТЬ ПОРОГИ


Пороги звітування контролюють, які звернення повідомляються у вихідних файлах (основний вихід,
--tblout та --domtblout). У кожній ітерації звернення послідовності та звернення до домену оцінюються
за статистичною значущістю (E-value), а вихідні дані генеруються у двох розділах, які називаються за-
цільовий та доменний вихід. У вихідних даних для кожної цілі за замовчуванням вся послідовність потрапляє з символом
Повідомляється значення E <= 10. У вихідних даних для кожного домену для кожної цілі, яка пройшла за-
цільові пороги звітності, усі домени, які задовольняють порогові значення звітності для кожного домену,
повідомили. За замовчуванням це домени з умовними E-значеннями <= 10. Наступне
Опції дозволяють змінити стандартні пороги звітності E-value або використовувати бітовий рейтинг
натомість пороги.

-E Звітувати про послідовності з E-значеннями <= у виводі за послідовність. За замовчуванням встановлено значення 10.0.

-T Використовуйте поріг бітової оцінки для виводу за послідовність замість порогового значення E-value
(будь-які налаштування -E ігнорується). Повідомити про послідовності з бітовою оцінкою >= . По
за замовчуванням цей параметр не встановлено.

-Z Оголосити загальний розмір бази даних послідовності, для цілей E-значення
розрахунок. Зазвичай E-значення обчислюються відносно розміру бази даних
ви насправді шукали (наприклад, кількість послідовностей у target_seqdb). В деяких
випадків (наприклад, якщо ви розділили базу даних цільової послідовності на кілька
файли для розпаралелювання вашого пошуку), можливо, вам краще знати, який фактичний розмір
вашого простору пошуку.

--domE
Звіт про домени з умовними E-значеннями <= у виводі для кожного домену, крім того
до домену з найвищим рейтингом за значне звернення послідовності. За замовчуванням встановлено значення 10.0.

--domT
Використовуйте поріг бітової оцінки для виводу для кожного домену замість порогового значення E-value
(будь-які налаштування --domT ігнорується). Повідомити про домени з бітовою оцінкою >= in
вихід на домен, на додаток до домену з найвищою оцінкою за значущу послідовність
вдарити. За замовчуванням цей параметр не встановлено.

--domZ
Оголосити кількість значущих послідовностей послідовності, для цілей
умовне обчислення E-значення для додаткової значимості домену. Зазвичай
умовні E-значення розраховуються відносно кількості пройдених послідовностей
поріг звітності за послідовність.

ВАРІАНТИ КОНТРОЛЬ ВКЛЮЧЕННЯ ПОРОГИ


Пороги включення контролюють, які звернення включаються до множинного вирівнювання та профілю
сконструйовано для наступної ітерації пошуку. За замовчуванням послідовність повинна мати
послідовність E-значення <= 0.001 (див -E опція), які потрібно включити, і будь-які додаткові домени
він, крім найкращого, повинен мати умовне значення E <= 0.001 (див. --domE
варіант). Різниця між пороговими значеннями звітності та порогами включення полягає в тому, що
Пороги включення контролюють, які звернення фактично використовуються на наступній ітерації (або
кінцевий вихід множинного вирівнювання, якщо -A використовується параметр), тоді як пороги звітності
контролювати те, що ви бачите на виводі. Пороги звітності, як правило, більш вільні, тому ви можете
побачити граничні хіти у верхній частині шуму, які можуть бути цікавими.

--incE
Включіть послідовності з E-значеннями <= при наступній ітерації або остаточному вирівнюванні
вихід за допомогою -A. За замовчуванням – 0.001.

--incT
Використовуйте поріг бітової оцінки для включення на послідовність замість E-значення
поріг (будь-яке налаштування --incE ігнорується). Включіть послідовності з бітовою оцінкою
>= . За замовчуванням цей параметр не встановлено.

--incdomE
Включити домени з умовними E-значеннями <= в наступній ітерації або остаточно
вирівнювання виведення за -A, на додаток до домену з найвищою оцінкою за знач
хіт послідовності. За замовчуванням встановлено значення 0.001.

--incdomT
Використовуйте поріг бітової оцінки для включення на домен замість порогового значення E-value
(будь-які налаштування --incT ігнорується). Включіть домени з бітовою оцінкою >= . По
за замовчуванням цей параметр не встановлено.

ВАРІАНТИ КОНТРОЛЬ АКСЕЛЕРАЦІЯ ЕВРИСТИКА


Пошук HMMER3 прискорюється в конвеєрі фільтрів із трьох кроків: фільтр MSV, the
Фільтр Вітербі і фільтр Вперед. Перший фільтр найшвидший і найшвидший
приблизний; останнє — це повний алгоритм прямого підрахунку балів, найповільніший, але найточніший.
Між MSV і Viterbi також є крок фільтра зміщення. Цілі, які проходять усі кроки
в конвеєрі прискорення потім піддаються постобробці -- ідентифікації домену
та підрахунок за допомогою алгоритму Вперед/Назад.

По суті, єдиними вільними параметрами, які керують евристичними фільтрами HMMER, є P-
порогові значення, що контролюють очікувану частку негомологічних послідовностей, які проходять
фільтри. Встановлення вищих порогових значень за замовчуванням передасть більшу частку
негомологічна послідовність, що підвищує чутливість за рахунок швидкості; навпаки,
встановлення нижчих порогових значень P буде проходити меншу частку, зменшуючи чутливість
і збільшення швидкості. Встановлення порога P-значення фільтра на 1.0 означає, що він пройде
всі послідовності, і ефективно вимикає фільтр.

Зміна порогових значень фільтра лише вилучає або включає цілі з розгляду; змінюється
Порогові значення фільтра не змінюють бітові оцінки, E-значення або вирівнювання, усі вони
визначається виключно під час постобробки.

--макс Максимальна чутливість. Вимкніть усі фільтри, включаючи фільтр зміщення, і запустіть на повну
Постобробка вперед/назад для кожної цілі. Це підвищує чутливість
трохи, з великою вартістю в швидкості.

--F1
Перший поріг фільтрації; встановити поріг P-значення для кроку фільтра MSV. The
за замовчуванням дорівнює 0.02, що означає, що приблизно 2% найвищої оцінки є негомологічними
Очікується, що цілі пройдуть фільтр.

--F2
Другий поріг фільтрації; встановіть поріг P-значення для кроку фільтра Вітербі.
За замовчуванням 0.001.

--F3
Третій поріг фільтрації; встановіть поріг значення P для кроку фільтра «Вперед». The
за замовчуванням 1e-5.

--нобіас
Вимкніть фільтр зміщення. Це дещо підвищує чутливість, але може призвести до а
висока вартість у швидкості, особливо якщо запит має упереджений склад залишків (наприклад
область повторюваної послідовності, або якщо це мембранний білок з великими ділянками
гідрофобність). Без фільтра зміщення занадто багато послідовностей можуть пройти фільтр
із упередженими запитами, що призводить до нижчої, ніж очікувалося, продуктивності
Інтенсивні обчислення алгоритми «Вперед/Назад» надзвичайно важкі
завантажити.

ВАРІАНТИ КОНТРОЛЬ ПРОФІЛЬ БУДІВНИЦТВО (ПІЗНЕМ ІТЕРАЦІЇ)


Ці параметри визначають, як стовпці консенсусу визначаються в кількох вирівнюваннях, коли
будівельні профілі. За замовчуванням, Jackhmmer завжди включає вашу оригінальну послідовність запитів
результат вирівнювання на кожній ітерації, а позиції консенсусу визначаються цим запитом
послідовність: тобто за замовчуванням Jackhmmer профіль завжди такої ж довжини, як і оригінал
запиту на кожній ітерації.

--швидко Визначте стовпці консенсусу як ті, які мають дріб >= симфрак залишків як
протиставляється прогалинам. (Див. нижче про --symfrac опція.) Хоча це за замовчуванням
варіант конструкції профілю в іншому місці (в hmmbuild, зокрема), може мати
небажані ефекти в Jackhmmer, тому що профіль може ітеративно входити
простір послідовності від вихідного запиту, залишаючи кілька консенсусних стовпців або взагалі не залишаючи їх
що відповідає його залишкам.

--рука Визначте стовпці консенсусу в наступному профілі, використовуючи довідкову анотацію до множини
вирівнювання. Jackhmmer поширює довідкову анотацію з попереднього профілю до
багаторазове вирівнювання, а потім до наступного профілю. Це значення за замовчуванням.

--symfrac
Визначте поріг фракції залишку, необхідний для визначення консенсусного стовпця, коли
використання --швидко варіант. За замовчуванням встановлено значення 0.5. Символьна частка в кожному стовпці дорівнює
обчислюється після врахування відносного зважування послідовності та ігнорування розриву
символи, що відповідають кінцям фрагментів послідовності (на відміну від внутрішніх
вставки/видалення). Встановлення значення 0.0 означає, що кожен стовпець вирівнювання буде
призначатися як консенсус, що може бути корисним у деяких випадках. Встановивши значення 1.0
означає, що будуть лише стовпці, які містять 0 пропусків (внутрішні вставки/видалення).
призначається як консенсус.

--fragthresh
Ми хочемо рахувати термінальні проміжки як видалення лише якщо відома вирівняна послідовність
бути повним, а не фрагментом (наприклад, тому що лише його частина
був послідовний). HMMER використовує просте правило для визначення фрагментів: якщо довжина послідовності
L менше або дорівнює дробу помножена на довжину вирівнювання в стовпцях,
тоді послідовність обробляється як фрагмент. За замовчуванням встановлено значення 0.5. Налаштування
--fragthresh0 визначить жодну (непорожню) послідовність як фрагмент; ви можете захотіти
зробіть це, якщо ви знаєте, що у вас є ретельно підібране вирівнювання повної довжини
послідовності. Налаштування --fragthresh1 визначить усі послідовності як фрагменти; ти можеш
хочете зробити це, якщо ви знаєте, що ваше вирівнювання повністю складається з фрагментів, наприклад
як перекладені короткі зчитування в даних метагеномної зброї.

ВАРІАНТИ КОНТРОЛЬ РОБОТИ Ваги


Кожного разу, коли профіль створюється з множинного вирівнювання, HMMER використовує спеціальну послідовність
алгоритм зважування для зменшення ваги тісно пов'язаних послідовностей і збільшення віддаленої ваги
ті. Це робить моделі менш упередженими через нерівномірність філогенетики
представництво. Наприклад, дві ідентичні послідовності зазвичай отримують половину
ваги, яку мала б одна послідовність (і ось чому Jackhmmer не хвилюється завжди
включаючи початкову послідовність запитів у вирівнювання кожної ітерації, навіть якщо вона її знайде
знову в базі даних, яку ви шукаєте). Ці параметри визначають, який алгоритм буде використано.

--wpb Використовуйте схему зважування послідовності на основі позиції Генікоффа [Henikoff and Henikoff,
J. Mol. біол. 243:574, 1994]. Це значення за замовчуванням.

--wgsc Використовуйте алгоритм зважування Gerstein/Sonnhammer/Chothia [Gerstein et al, J. Mol.
біол. 235:1067, 1994].

--wblosum
Використовуйте ту саму схему кластеризації, яка була використана для зважування даних при обчисленні BLOSUM
матриці підстановки [Henikoff and Henikoff, Proc. Natl. акад. Sci 89:10915, 1992].
Послідовності групуються по одному зв’язку на порозі ідентичності (за замовчуванням 0.62; див.
--шир) і в кожному кластері c послідовностей кожна послідовність отримує відносну вагу
1/c.

--немає
Відносних ваг немає. Усім послідовностям присвоюється однакова вага.

--шир
Встановлює поріг ідентичності, який використовується при однозв’язній кластеризації --wblosum.
Недійсний з будь-якою іншою схемою зважування. За замовчуванням 0.62.

ВАРІАНТИ КОНТРОЛЬ ЕФЕКТИВНО ПОСЛІДОВНІСТЬ НОМЕР


Після визначення відносних ваг вони нормалізуються до суми до загальної ефективної
порядковий номер, eff_nseq. Це число може бути фактичною кількістю послідовностей у
вирівнювання, але воно майже завжди менше. Зважування ентропії за замовчуванням
метод (--eent) зменшує ефективний порядковий номер, щоб зменшити вміст інформації
(відносна ентропія, або середня очікувана оцінка справжніх гомологів) на консенсусну позицію. The
цільова відносна ентропія контролюється функцією з двома параметрами, де два параметра
параметри встановлюються за допомогою -- Ось та --езигма.

--eent Налаштуйте ефективний порядковий номер для досягнення певної відносної ентропії за
положення (див -- Ось). Це значення за замовчуванням.

--екклюст
Встановіть ефективний порядковий номер на кількість кластерів з одним зв’язком у a
конкретний поріг ідентифікації (див -- Ід). Цей варіант не рекомендується; це для
експерименти, які оцінюють, наскільки краще --eent є.

--енон
Вимкніть ефективне визначення порядкового номера та просто використовуйте фактичну кількість
послідовності. Одна з причин, чому ви захочете це зробити, — спробувати максимізувати відносну
ентропія/позиція вашої моделі, що може бути корисно для коротких моделей.

--eset
Явно встановіть ефективний порядковий номер для всіх моделей .

-- Ось
Встановіть мінімальну відносну ентропію/ціль положення . Вимагає --eent. За замовчуванням
залежить від алфавіту послідовності; для білкових послідовностей це 0.59 біт/позицію.

--езигма
Встановлює мінімальну відносну ентропію, яку сприяє вирівнювання всієї моделі
на всю його довжину. Це призводить до того, що короткі моделі мають вищий відносний
ентропія на позицію ніж -- Ось один би дав. За замовчуванням – 45.0 біт.

-- Ід
Встановлює дробове попарне відсічення ідентичності, яке використовується для кластеризації одного зв’язку з
--екклюст варіант. За замовчуванням 0.62.

ВАРІАНТИ КОНТРОЛЬ Пріори


У побудові профілю за замовчуванням зважені підрахунки перетворюються на середні апостеріори
оцінки параметрів ймовірності з використанням априорів Діріхле. Стандартна суміш Діріхле
будуються попередні параметри для білкових моделей і моделей нуклеїнових кислот (РНК і ДНК).
in. Наведені нижче параметри дозволяють вам замінити пріоритети за замовчуванням.

--pnone Не використовуйте жодних пріорів. Параметри ймовірності будуть просто спостережуваними
частоти після зважування відносної послідовності.

--місце Використовуйте попередній Лаплас +1 замість стандартної суміші Діріхле.

ВАРІАНТИ КОНТРОЛЬ Е-ЗНАЧЕННЯ КАЛІБРАЦІЯ


Оцінка параметрів розташування для очікуваного розподілу оцінок для фільтра MSV
оцінки, оцінки фільтра Вітербі та бали вперед вимагають трьох коротких випадкових послідовностей
моделювання.

--ЕмЛ
Встановлює довжину послідовності в симуляції, яка оцінює параметр розташування mu для
MSV фільтр E-значення. За замовчуванням 200.

--EmN
Встановлює кількість послідовностей у симуляції, яка оцінює параметр розташування mu
для E-значень фільтра MSV. За замовчуванням 200.

--EvL
Встановлює довжину послідовності в симуляції, яка оцінює параметр розташування mu для
Фільтр Вітербі E-значення. За замовчуванням 200.

--ЕвН
Встановлює кількість послідовностей у симуляції, яка оцінює параметр розташування mu
для фільтрів Вітербі E-значення. За замовчуванням 200.

--EfL
Встановлює довжину послідовності в симуляції, яка оцінює параметр розташування tau
для прямих E-значень. За замовчуванням 100.

--EfN
Встановлює кількість послідовностей у симуляції, яка оцінює параметр розташування
tau для прямих E-значень. За замовчуванням 200.

--Eft
Встановлює масову частку хвоста так, щоб вона вписувалася в моделювання, яке оцінює місце розташування
параметр tau для прямих оцінок. За замовчуванням 0.04.

ІНШІ ВАРІАНТИ


--ненульовий2
Вимкніть виправлення балів null2 для упередженої композиції.

-Z Підтвердьте, що загальна кількість цілей у ваших пошуках дорівнює , для цілей
розрахунків E-value за послідовність, а не фактичної кількості цілей
бачив.

--domZ
Підтвердьте, що загальна кількість цілей у ваших пошуках дорівнює , для цілей
умовних обчислень E-значення для кожного домену, а не кількості цілей
які подолали пороги звітності.

--насіння
Заповніть генератор випадкових чисел за допомогою , ціле число >= 0. Якщо є >0, будь-який
стохастичні моделювання будуть відтворюваними; та сама команда дасть те саме
результати. Якщо дорівнює 0, генератор випадкових чисел заповнюється довільно, і
стохастичні симуляції будуть відрізнятися від виконання до виконання однієї і тієї ж команди. За замовчуванням
насіння - 42.

--qformat
Оголосити, що введення query_seqfile є у форматі . Прийнято файл послідовності
формати включають FASTA, EMBL, GenBank, DDBJ, UniProt, Stockholm і SELEX. За замовчуванням
полягає в автоматичному визначенні формату файлу.

--tformat
Оголосити, що введення target_seqdb є у форматі . Прийнято файл послідовності
формати включають FASTA, EMBL, GenBank, DDBJ, UniProt, Stockholm і SELEX. За замовчуванням
полягає в автоматичному визначенні формату файлу.

--ЦП
Встановіть кількість паралельних робочих потоків . За замовчуванням HMMER встановлює для цього значення
кількість ядер ЦП, яку він виявляє у вашій машині, тобто намагається максимізувати
використання наявних процесорних ядер. Налаштування вище за кількість
доступні ядра мають незначну цінність, але ви можете щось налаштувати
менше. Ви також можете керувати цим числом, встановивши змінну середовища,
HMMER_NCPU.

Цей параметр доступний, лише якщо HMMER був скомпільований з підтримкою потоків POSIX.
Це значення за замовчуванням, але воно, можливо, було вимкнено під час компіляції для вашого сайту
чи машина чомусь.

-- стійло
Для налагодження основної/робочої версії MPI: призупиніть після запуску, щоб увімкнути
розробника, щоб підключити налагоджувачі до запущеного головного та робочого процесів. Надіслати
Сигнал SIGCONT для зняття паузи. (Під gdb: (GDB) сигналізувати НАДАЛЬШЕ) (Тільки
доступний, якщо під час компіляції було ввімкнено додаткову підтримку MPI.)

--mpi Запустити в режимі MPI master/worker, використовуючи мпірун. (Доступно лише за наявності додаткового MPI
підтримка була включена під час компіляції.)

Використовуйте jackhmmer онлайн за допомогою служб onworks.net



Найновіші онлайн-програми для Linux і Windows