англійськафранцузькаіспанська

Ad


Значок OnWorks

cmcalibrate - онлайн у хмарі

Запустіть cmcalibrate у постачальника безкоштовного хостингу OnWorks через Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

Це команда cmcalibrate, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн емулятор Windows або онлайн емулятор MAC OS

ПРОГРАМА:

ІМ'Я


cmcalibrate - підігнати експоненціальні хвости для визначення коваріаційної моделі E-значення

СИНТАКСИС


cmкалібрувати [параметри] cmfile

ОПИС


cmкалібрувати визначає експоненціальні параметри хвоста для визначення E-значення шляхом генерування
випадкові послідовності, пошук їх за допомогою CM і збір результатів
хіти. Гістограма бітових оцінок звернень узгоджується з експоненційним хвостом і
параметри підігнаного хвоста зберігаються у файлі CM. Експоненційні параметри хвоста
потім використовуються для оцінки статистичної значущості звернень, знайдених у cmsearch та
cmscan.

Файл CM необхідно відкалібрувати за допомогою cmкалібрувати перед тим, як його можна буде використовувати в cmsearch or cmscan,
з єдиним винятком: не потрібно калібрувати файли CM, які включають тільки
моделі з нульовими базовими парами перед запуском cmsearch.

cmкалібрувати дуже повільно. Для калібрування єдиного середнього розміру потрібно кілька годин
CM на одному ЦП. cmкалібрувати буде працювати паралельно на всіх доступних ядрах if Infernal
був побудований на системі, яка підтримує потоки POSIX (див. розділ Встановлення
посібник користувача для отримання додаткової інформації). Використання ядер призведе до приблизно Раза
прискорення в порівнянні з одним процесором. MPI (Message Passing Interface) також може використовуватися для
паралелізація з --mpi варіант, якщо Infernal було створено з увімкненим MPI, але з використанням
більше ніж 161 процесор не рекомендується, оскільки збільшення після 161 не прискорить
калібрування. Додаткову інформацію див. у розділі «Встановлення» посібника користувача.

Команда --прогноз Опцію можна використовувати, щоб оцінити, скільки часу буде потрібно для виконання програми протягом a
даний cmfile на поточній машині. Щоб передбачити час роботи на процесори з
MPI, додатково використовуйте --nпрогноз варіант.

Випадкові послідовності для пошуку cmкалібрувати генеруються HMM, на якому пройшли навчання
реальні геномні послідовності з різним вмістом GC. Мета – мати дистрибутиви GC
у випадкових послідовностях бути подібними до тих у фактичних геномних послідовностях.

Виконуються чотири раунди пошуку та наступні експоненційні підборки хвоста, по одному для кожного
чотири різні алгоритми CM, які можна використовувати cmsearch та cmscan: глобальний CYK,
glocal Inside, локальний CYK і локальний Inside.

Параметри E-values ​​визначаються за допомогою cmкалібрувати використовуються лише cmsearch та cmscan
програми. Якщо ви не збираєтеся використовувати ці програми, не витрачайте час на калібрування
ваші моделі.

ВАРІАНТИ


-h Допомога; надрукувати коротке нагадування про використання командного рядка та доступні параметри.

-L Встановіть загальну довжину випадкових послідовностей для пошуку мегабази (Мб). За
за замовчуванням, is 1.6 Мб. Збільшення зробить експоненційний хвіст більше підходить
точніші та E-значення точніші, але це займе більше часу (подвоїння буде приблизно
подвоїти час роботи). Зменшення не рекомендується, оскільки це призведе до
підходить менш точно, а E-значення менш точні.

ВАРІАНТИ ДЛЯ ПРОГНОЗУВАННЯ ВИМАГАЄТЬСЯ ЧАС І ПАМ'ЯТЬ


--прогноз
Спрогнозувати час виконання калібрування cmfile (з наданими параметрами) увімкнено
поточної машини та вийти. Калібрування не проводиться. Прогнози
слід вважати приблизними оцінками. Якщо багатопоточність увімкнена (див
Розділ інсталяції посібника користувача), час буде враховувати число
наявних ядер.

--nпрогноз
з --прогноз, вкажіть це для калібрування будуть використані процесори.
Це може бути корисно для прогнозування часу виконання запуску MPI
процесори

--memreq
Спрогнозуйте обсяг пам’яті, необхідної для калібрування cmfile (з наданими
параметри) на поточній машині та вийдіть. Калібрування не проводиться.

ВАРІАНТИ КОНТРОЛЬ ЕКСПОНЕНЦІЙНИЙ ХВІСТ FITS


--gtailn
підігнати експоненційний хвіст для glocal Inside і glocal CYK до найвищі бали
в хвості гістограми, де is разів кількість пошукових Мб. The
значення за замовчуванням дорівнює 250. Значення 250 було вибрано, оскільки воно добре працює
емпірично відносно інших цінностей.

--ltailn
підігнати експоненційний хвіст для локального Inside і локального CYK до найвищі бали
в хвості гістограми, де is разів кількість пошукових Мб. The
значення за замовчуванням дорівнює 750. Значення 750 було вибрано, оскільки воно добре працює
емпірично відносно інших цінностей.

-- хвіст
Ігноруйте --gtailn та --ltailn префіксовані параметри та відповідні фракція хвіст
гістограму до експоненціального хвоста для всіх режимів пошуку.

ДОДАТКОВО ВИХІД ФАЙЛИ


--hfile
Збережіть відповідні гістограми до файлу . Формат цього файлу — два пробіли
розділені стовпці на рядок. Перший стовпець – це значення бітової оцінки по осі Х
кожен ящик. Другий стовпець – це значення кількості звернень на бірку по осі Y. Кожен
серія розмежована рядком з одним символом «&». Файл буде містити
одна серія для кожного з чотирьох експоненційних хвостів укладається в такому порядку:
glocal CYK, glocal Inside, локальний CYK та локальний Inside.

--файл
Збережіть інформацію про план виживання у файл . Формат цього файлу — два пробіли
розділені стовпці на рядок. Перший стовпець – це значення бітової оцінки по осі Х
кожен ящик. Другий стовпець – це значення частки звернень, які відповідають або
перевищувати оцінку для кожного ящика. Кожна серія розмежована лінією з одиницею
символ «&». Файл міститиме три серії даних для кожного з чотирьох CM
режими пошуку в такому порядку: glocal CYK, glocal Inside, локальний CYK та
місцевий Всередині. Перша серія — це емпіричний графік виживання з гістограми
звернень до випадкової послідовності. Друга серія — це експоненційний хвіст
емпіричний розподіл. Третя серія — це експоненціальна підгонка хвоста, якщо лямбда
були зафіксовані та встановлені як натуральний журнал 2 (0.691314718).

--qqфайл
Збережіть інформацію про квантиль-квантиль у файл . Формат цього файлу
два стовпці, розділені пробілами на рядок. Перший стовпець – це значення осі x, і
другий стовпець - це значення осі Y. Відстань точок від
тотожна лінія (y=x) є мірою того, наскільки добре експоненціальне прилягання хвоста
ближче точки до лінії тотожності, тим краще прилягання. Кожна серія є
розділені рядком з одним символом «&». Файл буде містити одну серію
емпіричних даних для кожного з чотирьох експоненційних хвостів відповідає наступному
порядок: glocal CYK, glocal Inside, локальний CYK і локальний Inside.

--file
Заощаджуйте статистику різних експоненційних хвостів у файлі з роздільниками .
Файл міститиме значення лямбда та мю для експоненційних хвостів
хвости гістограми різного розміру. Поля у файлі позначені
інформативно.

--xfile
Збережіть у файл список балів у хвості гістограми . Кожен рядок
цей файл матиме іншу оцінку, що вказує на те, що в хвості існувало одне звернення
цей рахунок. Кожна серія розділена рядком з одним символом «&». The
файл міститиме одну серію для кожного з чотирьох експоненційних хвостових вписів у
у такому порядку: glocal CYK, glocal Inside, локальний CYK та локальний Inside.

ІНШІ ВАРІАНТИ


--насіння
Заповніть генератор випадкових чисел за допомогою , ціле число >= 0. Якщо відмінний від нуля,
стохастичні моделювання будуть відтворюваними; та сама команда дасть те саме
результати. Якщо дорівнює 0, генератор випадкових чисел заповнюється довільно, і
стохастичні симуляції будуть відрізнятися від виконання до виконання однієї і тієї ж команди. За замовчуванням
насіння - 181.

--бета
За замовчуванням для прискорення пошуку CM використовується залежна від запиту смуга (QDB).
алгоритми з імовірністю втрати бета-хвосту 1E-15. Це значення бета-версії може бути
змінено на з --бета . Бета-параметр — це величина ймовірності
маса виключена під час розрахунку діапазону, більші значення бета дають більші прискорення
але жертвувати більшою точністю, ніж нижчими значеннями. За замовчуванням використовується значення 1E-15.
(Для отримання додаткової інформації про QDB див. Nawrocki and Eddy, PLoS Computational Biology
3(3): e56.)

--безсмуговий
Вимкніть QDB під час калібрування E-value. Це сповільнить калібрування.

--ненульовий3
Вимкніть null3 post hoc додаткову нульову модель. Це не рекомендується, якщо
ви плануєте використовувати той самий варіант cmsearch та / або cmscan.

--випадковий
Натомість використовуйте фонову нульову модель CM для створення випадкових послідовностей
більш реалістичного HMM. Якщо CM не було створено з використанням --нуль варіант до
cmbuild, фонова нульова модель становитиме 25% кожного A, C, G та U.

--gc
Згенеруйте випадкові послідовності, використовуючи розподіл нуклеотидів із послідовності
файл .

--ЦП
Вкажіть це використовувати паралельні працівники ЦП. Якщо встановлюється як "0", то
програма буде запускатися в послідовному режимі, без використання потоків. Ви також можете контролювати
це число шляхом встановлення змінної середовища, INFERNAL_NCPU. Цей варіант буде
бути доступним лише в тому випадку, якщо машина, на якій було побудовано Infernal, здатна використовувати
POSIX threading (докладніше дивіться в розділі «Встановлення» посібника користувача
інформація).

--mpi Запустити як паралельну програму MPI. Ця опція буде доступна лише за наявності у Infernal
було налаштовано та створено з прапором «--enable-mpi» (див. інсталяцію
розділ посібника користувача для отримання додаткової інформації).

Використовуйте cmcalibrate онлайн за допомогою служб onworks.net


Безкоштовні сервери та робочі станції

Завантажте програми для Windows і Linux

Команди Linux

Ad