англійськафранцузькаіспанська

Ad


Значок OnWorks

hmmsim - онлайн в хмарі

Запустіть hmmsim у постачальника безкоштовного хостингу OnWorks через Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

Це команда hmmsim, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн емулятор Windows або онлайн емулятор MAC OS

ПРОГРАМА:

ІМ'Я


hmmsim - збирайте розподіл балів у випадкових послідовностях

СИНТАКСИС


хммсім [параметри]

ОПИС


Команда хммсім програма генерує випадкові послідовності, оцінює їх з моделлю(ами) в ,
і виводить різноманітні гістограми, графіки та підігнані розподіли для результату
балів.

хммсім не є основною частиною пакету HMMER. У більшості користувачів не було б жодних причин
використай це. Він використовується для розробки та перевірки статистичних методів, що використовуються для визначення P-значень
і E-значення в HMMER3. Наприклад, він використовувався для отримання більшості результатів у 2008 році
стаття про локальну статистику вирівнювання H3 (PLoS Comp Bio 4:e1000069, 2008);
http://www.ploscompbiol.org/doi/pcbi.1000069).

Оскільки це дослідницький стенд, не варто очікувати, що він буде таким же надійним, як інші
програми в пакеті. Наприклад, параметри можуть взаємодіяти дивним чином; ми не маємо
перевіряв і не намагався передбачити всі різні можливі комбінації.

Головне завдання — підігнати розподіл максимальної імовірності Гамбеля до балів Вітербі або an
максимальна ймовірність експоненційного хвоста до високої результативності форвардів, і перевірити, що це
підігнані розподіли підкоряються припущенню, що лямбда ~ log_2 для обох параметрів Вітербі Гумбеля
і експоненційний хвіст вперед.

Вихідним є таблиця чисел, по одному рядку для кожної моделі. Чотири різні параметри
до даних оцінки перевіряються: (1) максимальна ймовірність відповідає як місцеположенню (му/тау), так і
параметри нахилу (лямбда); (2) за умови, що lambda=log_2, максимальна ймовірність відповідає параметру
тільки параметр розташування; (3) те саме, але припускаючи лямбду з виправленням по краю, використовуючи струм
процедури в H3 [Eddy, 2008]; і (4) з використанням обох параметрів, визначених струмом Н3
процедури. Стандартна проста, швидка та брудна статистика для добротності - "E@10",
розрахована величина E для 10-го найпопулярнішого хіта, яке, як ми очікуємо, буде приблизно 10.

Детально, стовпці виводу такі:

ім'я Назва моделі.

tailp Частина найвищих балів, використана для відповідності розподілу. Для Вітербі, MSV та
Гібридні бали, за замовчуванням це 1.0 (розподіл Gumbel підходить для всіх
дані). Для форвардних балів це значення за замовчуванням дорівнює 0.02 (експоненційний хвіст встановлюється до
найвищі 2% балів).

мю/тау Параметр розташування для максимальної ймовірності відповідності даним.

лямбда Параметр нахилу для максимальної ймовірності відповідності даним.

E@10 Значення E, розраховане для 10-го рейтингу ("E@10") за допомогою ML mu/tau
і лямбда. За визначенням, це очікується приблизно 10, якби була оцінка E-значення
точний.

муфікс Параметр розташування, для максимальної ймовірності відповідності з відомим (фіксованим) нахилом
параметр лямбда log_2 (0.693).

E@10fix
E-value розраховано для 10-го рейтингу за допомогою муфіксу та очікуваного
лямбда = log_2 = 0.693.

mufix2 Параметр розташування для максимальної ймовірності відповідності з виправленим краєвим ефектом
лямбда.

E@10fix2
Значення E, обчислене для 10-го рейтингу за допомогою mufix2 та граничного ефекту-
виправлена ​​лямбда.

PMU Параметр розташування, визначений процедурами оцінки H3.

пламбда
Параметр нахилу, визначений процедурами оцінки H3.

pE@10 Значення E, розраховане для 10-го рейтингу за допомогою pmu, plambda.

У кінці цієї таблиці друкується ще один рядок, який починається з # і підсумовує
загальний час процесора, що використовується моделюванням.

Деякі додаткові вихідні файли мають формат xmgrace xy. xmgrace потужний і безкоштовний
доступне програмне забезпечення для побудови графіків.

РІЗНЕ ВАРІАНТИ


-h Допомога; надрукувати коротке нагадування про використання командного рядка та всі доступні параметри.

-a Зібрати очікувану статистику довжини вирівнювання за Вітербі з кожної змодельованої послідовності.
Це працює лише з оцінками Вітербі (за замовчуванням; див --віт). Два додаткових
У вихідній таблиці для кожної моделі друкуються поля: середня довжина Вітербі
вирівнювання та стандартне відхилення.

-v (Дослівно). Роздрукуйте також оцінки, по одній оцінці на рядок.

-L Установіть довжину випадково відібраних (немомологічних) послідовностей ,
за замовчуванням - 100.

-N Встановіть кількість випадково відібраних послідовностей . За замовчуванням – 1000.

--mpi Запустити в паралельному режимі MPI, під мпірун. Вона розпаралелюється на рівні відправлення
один профіль за раз до робочого процесу MPI, тому паралелізація допомагає лише якщо
у вас є більше одного профілю в , а ви хочете мати хоча б як
багато профілів як робочі процеси MPI. (Доступно лише за наявності додаткової підтримки MPI
увімкнено під час компіляції.)

ВАРІАНТИ КОНТРОЛЬ ВИХІД


-o Збережіть основну вихідну таблицю у файл а не надсилати його на стандартний вихід.

--файл
При зборі статистики вирівнювання Вітербі ( -a варіант) для кожної вибірки
послідовності, вивести два поля на рядок у файл : довжина оптимальної
вирівнювання та оцінка біта Вітербі. Вимагає, щоб -a також використовується опція.

--файл
Виведіть у файл графік залежності рангу від E-value у форматі XMGRACE xy . Вісь x є
ранг цієї послідовності, від найвищого до найнижчого; вісь y є значенням E
розраховано для цієї послідовності. E-значення розраховуються з використанням стандартних процедур H3
(тобто параметри pmu, plambda у вихідній таблиці). Ви очікуєте жорсткого матчу
між рангом і E-значенням, якщо E-значення точно оцінені.

--file
Вивести файл "потужність фільтра". : для кожної моделі рядок із трьома полями:
назва моделі, кількість послідовностей, що переходять поріг значення P, і частка
послідовності, що перевершують поріг P-значення. Побачити --pthresh для встановлення P-значення
threshold, який за замовчуванням дорівнює 0.02 (порогове значення фільтра MSV за замовчуванням у H3). П-
значення визначаються стандартними процедурами H3 (параметри pmu,plambda в
вихідна таблиця). Якщо все в порядку, ви очікуєте, що потужність фільтра дорівнює
передбачувана установка P-значення порогового значення.

--pfile
Вивести кумулятивні графіки виживання (P(S>x)) у файл у форматі XMGRACE xy. Там
є три графіки: (1) спостережуваний розподіл балів; (2) максимальна ймовірність
встановлений розподіл; (3) максимальна ймовірність, що відповідає параметру розташування
(му/тау) поки
припускаючи lambda=log_2.

--xfile
Виведіть оцінки бітів у вигляді двійкового масиву подвійної точності (8 байт на
оцінка) подати . Такі програми, як Easel's esl-histplot може читати такі двійкові файли.
Це корисно при створенні надзвичайно великих розмірів вибірки.

ВАРІАНТИ КОНТРОЛЬ МОДЕЛЬ КОНФІГУРАЦІЯ (РЕЖИМ)


H3 використовує лише локальне вирівнювання з кількома зверненнями ( --fs режим), і це те, де ми віримо
статистичні відповідності. Результати локального вирівнювання Unihit (Сміт/Вотерман; --sw режим) також підкоряються нашим
статистичні здогади. Статистика глобального вирівнювання (або мультихіт, або унігіт).
все ще недостатньо зрозумілий і не адаптований.

--fs Збирайте оцінки локального вирівнювання з кількома попаданнями. Це значення за замовчуванням. вирівнювання як
«режим пошуку фрагментів».

--sw Збирайте результати локального вирівнювання unihit. Стан H3 J вимкнено. вирівнювання як
«Режим пошуку Сміта/Уотермена».

--ls Збирайте бали глокального вирівнювання з кількома попаданнями. У глокальному (глобальному/локальному) вирівнюванні
вся модель повинна вирівнятися з підпослідовністю цілі. Місцевий вхід/виїзд H3
ймовірності переходу вимкнені. "ls" походить з HMMER2 історичного
Термінологія для локального вирівнювання з кількома зверненнями як «режим локального пошуку».

--s Збирайте результати глобального вирівнювання unihit. Як стан H3 J, так і місцевий вхід/вихід
ймовірності переходу вимкнені. "s" походить з історії HMMER2
термінологія для глокального вирівнювання unihit.

ВАРІАНТИ КОНТРОЛЬ БАЛЮВАННЯ АЛГОРИТМ


--віт Зберіть бали максимального вирівнювання ймовірності Вітербі. Це значення за замовчуванням.

--fwd Збирайте логарифмічні бали ймовірності, підсумовані за ансамблем вирівнювання.

--гіб Збирайте «гібридні» бали, як описано в статтях Ю і Хва (наприклад,
Біоінформатика 18:864, 2002). Вони включають обчислення матриці вперед і отримання
максимальне значення комірки. Сама цифра статистично дещо невмотивована,
але очікується, що розподіл буде належним розподілом екстремальних значень
(Гамбель).

--msv Зберіть оцінки MSV (кілька нерозривних сегментів Вітербі) за допомогою основного H3
евристика прискорення.

--швидко Для будь-якого з наведених вище варіантів використовуйте оптимізовану виробничу реалізацію H3 (використання
SIMD векторизація). За замовчуванням використовувати реалізація пожертвувати невеликою
кількість числової точності. Це може викликати незрозумілий шум
статистичне моделювання та підгонки, тож коли людина стає дуже стурбована точністю
деталі, краще мати можливість вирахувати це джерело шуму.

ВАРІАНТИ КОНТРОЛЬ ПІДГОТОВЛЕНО ХВІСТ МАСИ ДЛЯ ВПЕРЕД


У деяких експериментах було корисно підігнати оцінки Forward до діапазону різних хвостів
маси, а не лише один. Ці варіанти забезпечують механізм для рівномірного розміщення
рознесений діапазон різної маси хвоста. Для кожної різної маси хвоста створюється лінія
на виході.

--tmin
Встановіть нижню межу розподілу маси хвоста. (За замовчуванням встановлено значення 0.02 для
за замовчуванням одна маса хвоста.)

--tmax
Встановіть верхню межу розподілу маси хвоста. (За замовчуванням встановлено значення 0.02 для
за замовчуванням одна маса хвоста.)

--tpoints
Встановіть кількість мас хвоста для зразка, починаючи з --tmin і закінчується на --tmax.
(За замовчуванням – 1, для маси одного хвоста за замовчуванням 0.02.)

--tлінійний
Випробуйте діапазон мас хвоста з рівномірним лінійним інтервалом. За замовчуванням використовується
рівномірний логарифмічний інтервал.

ВАРІАНТИ КОНТРОЛЬ H3 ПАРАМЕТР ОЦІНКА МЕТОДИ


H3 використовує три моделювання коротких випадкових послідовностей для оцінки параметрів розташування
очікуваний розподіл балів для результатів MSV, Viterbi та Forward. Ці
Опції дозволяють модифікувати ці моделювання.

--ЕмЛ
Встановлює довжину послідовності в симуляції, яка оцінює параметр розташування mu для
MSV E-значення. За замовчуванням 200.

--EmN
Встановлює кількість послідовностей у симуляції, яка оцінює параметр розташування mu
для MSV E-значень. За замовчуванням 200.

--EvL
Встановлює довжину послідовності в симуляції, яка оцінює параметр розташування mu для
Е-значення Вітербі. За замовчуванням 200.

--ЕвН
Встановлює кількість послідовностей у симуляції, яка оцінює параметр розташування mu
для E-значень Вітербі. За замовчуванням 200.

--EfL
Встановлює довжину послідовності в симуляції, яка оцінює параметр розташування tau
для прямих E-значень. За замовчуванням 100.

--EfN
Встановлює кількість послідовностей у симуляції, яка оцінює параметр розташування
tau для прямих E-значень. За замовчуванням 200.

--Eft
Встановлює масову частку хвоста так, щоб вона вписувалася в моделювання, яке оцінює місце розташування
параметр tau для прямих оцінок. За замовчуванням 0.04.

ВІДМОВЛЕННЯ ВАРІАНТИ


-- стійло
Для налагодження основної/робочої версії MPI: призупиніть після запуску, щоб увімкнути
розробника, щоб підключити налагоджувачі до запущеного головного та робочого процесів. Надіслати
Сигнал SIGCONT для зняття паузи. (Під gdb: (GDB) сигналізувати НАДАЛЬШЕ) (Тільки
доступний, якщо під час компіляції було ввімкнено додаткову підтримку MPI.)

--насіння
Встановіть початкове значення випадкового числа . За замовчуванням 0, що робить випадковим числом
генератор використовує довільне насіння, так що різні прогони хммсім буде майже
безумовно, створити іншу статистичну вибірку. Для налагодження корисно
примусово відтворювати результати, фіксуючи початкове число випадкових чисел.

ЕКСПЕРИМЕНТАЛЬНА ВАРІАНТИ


Ці варіанти були використані в невеликій кількості різноманітних дослідницьких експериментів.

--bgflat
Встановіть рівномірний розподіл фонового залишку, обидва для
цілі нульової моделі, що використовується для обчислення балів, а також для генерування
випадкові послідовності. За замовчуванням використовується стандартна фонова частота амінокислот
розподіл.

--bgcomp
Встановіть розподіл фонового залишку на середній склад профілю.
Це було використано для дослідження деяких ефектів упередженої композиції.

--x-no-lengthmodel
Вимкніть модель довжини цільової послідовності H3. Встановіть самопереходи для N,C,J
а нульову модель на 350/351; це емулює HMMER2. Не гарна ідея в
загальний. Це було використано для демонстрації однієї з основних відмінностей H2 та H3.

--ну
Встановіть параметр nu для алгоритму MSV – очікувану кількість нерозривних локальних
вирівнювання на цільову послідовність. За замовчуванням встановлено значення 2.0, що відповідає E->J
ймовірність переходу 0.5. Це було використано, щоб перевірити, чи має різний nu
істотний вплив на результат (здається, ні, в межах розумного). Тільки цей варіант
працює, якщо --msv вибрано (це впливає лише на MSV), і він не працюватиме з --швидко
(оскільки оптимізовані реалізації підключені до nu=2.0).

--pthresh
Встановіть поріг значення P фільтра для використання під час створення файлів потужності фільтра
--file. За замовчуванням встановлено значення 0.02 (що було б доречним для тестування оцінок MSV,
оскільки це порогове значення фільтра MSV за замовчуванням у конвеєрі прискорення H3.)
Інші відповідні варіанти (відповідність за замовчуванням у конвеєрі прискорення) були б
0.001 для Вітербі і 1e-5 для форварда.

Використовуйте hmmsim онлайн за допомогою служб onworks.net


Безкоштовні сервери та робочі станції

Завантажте програми для Windows і Linux

Команди Linux

Ad