АнглийскийФранцузскийИспанский

Ad


Значок OnWorks

hmmsim - Интернет в облаке

Запустите hmmsim в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда hmmsim, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


hmmsim - собирать распределения баллов по случайным последовательностям

СИНТАКСИС


хммм [опции]

ОПИСАНИЕ


Ассоциация хммм программа генерирует случайные последовательности, оценивает их с помощью модели (ей) в ,
и выводит различные виды гистограмм, графиков и подогнанных распределений для результирующих
баллы.

хммм не является основной частью пакета HMMER. У большинства пользователей не было бы причин
используй это. Он используется для разработки и тестирования статистических методов, используемых для определения P-значений.
и E-значения в HMMER3. Например, он использовался для получения большинства результатов в 2008 году.
документ о локальной статистике выравнивания H3 (PLoS Comp Bio 4: e1000069, 2008;
http://www.ploscompbiol.org/doi/pcbi.1000069).

Поскольку это исследовательский стенд, не стоит ожидать, что он будет таким же надежным, как другие
программы в пакете. Например, параметры могут взаимодействовать странным образом; у нас нет
проверял и не пытался предвидеть все возможные комбинации.

Основная задача - согласовать распределение Гамбеля максимального правдоподобия с оценками Витерби или
экспоненциальный хвост с максимальным правдоподобием для получения высоких оценок вперед, и проверить, что эти
подобранные распределения подчиняются гипотезе о том, что лямбда ~ log_2 для обеих функций Витерби Гамбеля
и передний экспоненциальный хвост.

Результатом является таблица чисел, по одной строке для каждой модели. Четыре разных параметрических подгонки
к данным оценки проверяются: (1) максимальное правдоподобие подходит как для местоположения (mu / tau), так и
параметры наклона (лямбда); (2) предполагая, что лямбда = log_2, максимальное правдоподобие соответствует
только параметр местоположения; (3) то же самое, но с учетом лямбды с коррекцией по краям, используя текущую
процедуры в H3 [Eddy, 2008]; и (4) с использованием обоих параметров, определяемых током H3
процедуры. Стандартная простая, быстрая и грязная статистика согласия - "E @ 10",
расчетное значение E для 10-го места в рейтинге лучших результатов, которое, как мы ожидаем, будет около 10.

Подробно столбцы вывода:

имя Название модели.

хвост Доля наивысших баллов, используемых для соответствия распределению. Для Витерби, MSV и
Гибридные оценки, по умолчанию это 1.0 (распределение Гамбеля подходит для всех
данные). Для форвардных баллов это значение по умолчанию 0.02 (экспоненциальный хвост приспособлен к
высшие 2% баллов).

му / тау Параметр местоположения для максимального правдоподобия соответствия данным.

лямбда Параметр наклона для максимального правдоподобия соответствия данным.

E @ 10 Значение E, рассчитанное для 10-го места с высоким баллом ('E @ 10') с использованием ML mu / tau.
и лямбда. По определению, это должно было быть около 10, если оценка E-value была
точный.

муфикс Параметр местоположения для максимального правдоподобия с известным (фиксированным) наклоном
параметр лямбда log_2 (0.693).

E @ 10fix
Значение E, рассчитанное для 10-го ранжированного балла с использованием mufix и ожидаемого
лямбда = log_2 = 0.693.

Муфикс2 Параметр местоположения для максимального правдоподобия с поправкой на краевой эффект
лямбда.

E @ 10fix2
Значение E, рассчитанное для 10-го балла с использованием mufix2 и краевого эффекта -
исправленная лямбда.

PMU Параметр местоположения, определяемый процедурами оценки H3.

Plambda
Параметр наклона определяется процедурами оценки H3.

pE @ 10 E-значение, рассчитанное для 10-го ранжированного балла с использованием pmu, plambda.

В конце этой таблицы печатается еще одна строка, начинающаяся с # и суммирующая
общее время процессора, использованное при моделировании.

Некоторые из дополнительных выходных файлов имеют формат xmgrace xy. xmgrace мощный и бесплатный
доступное программное обеспечение для построения графиков.

РАЗНОЕ ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


-h Помощь; напечатайте краткое напоминание об использовании командной строки и всех доступных параметрах.

-a Соберите ожидаемую статистику длины выравнивания Витерби из каждой моделируемой последовательности.
Это работает только с оценками Витерби (по умолчанию; см. --вит). Два дополнительных
поля печатаются в выходной таблице для каждой модели: средняя длина витерби
выравнивания и стандартное отклонение.

-v (Подробный). Выведите и оценки, по одной в каждой строке.

-L Установите длину случайно выбранных (негомологичных) последовательностей равной ,
по умолчанию - 100.

-N Установите количество случайно выбранных последовательностей на . По умолчанию 1000.

--mpi Запускать в параллельном режиме MPI под мпирун. Распараллеливается на уровне отправки
один профиль за раз для рабочего процесса MPI, поэтому распараллеливание помогает только в том случае, если
у вас более одного профиля в , и вы хотите иметь как минимум
многие профили в качестве рабочих процессов MPI. (Доступно только в том случае, если была установлена ​​дополнительная поддержка MPI.
включен во время компиляции.)

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ УПРАВЛЕНИЕ ВЫВОД


-o Сохранить основную таблицу вывода в файл вместо отправки на стандартный вывод.

--файл
При сборе статистики выравнивания Витерби ( -a вариант), для каждого отобранного
последовательность, выводить два поля на строку в файл : длина оптимального
выравнивание и битовый счет Витерби. Требует, чтобы -a вариант тоже используется.

--efile
Вывести график зависимости ранга от E-значения в формате XMGRACE xy в файл . Ось абсцисс - это
ранг этой последовательности от наивысшего к низшему; по оси ординат - значение E
рассчитано для этой последовательности. E-значения рассчитываются с использованием процедур H3 по умолчанию.
(т.е. параметры pmu, plambda в выходной таблице). Вы ожидаете грубого совпадения
между рангом и E-значением, если E-значения точно оценены.

--файл
Выведите файл "мощности фильтра" в : для каждой модели строка с тремя полями:
название модели, количество последовательностей, прошедших порог P-значения, и доля
последовательности, проходящие порог P-значения. Видеть --ptresh для установки значения P
порог, который по умолчанию равен 0.02 (порог фильтра MSV по умолчанию в H3). P-
значения определены процедурами H3 по умолчанию (параметры pmu, plambda в
таблица вывода). Если все в порядке, вы ожидаете увидеть мощность фильтра, равную
прогнозируемая установка P-значения порога.

--pfile
Вывод графиков совокупной выживаемости (P (S> x)) в файл в формате XMGRACE xy. Там
представлены три графика: (1) наблюдаемое распределение баллов; (2) максимальная вероятность
подогнанное распределение; (3) максимальное правдоподобие для параметра местоположения
(му / тау) в то время как
предполагая, что лямбда = log_2.

--xfile
Выведите битовые оценки в виде двоичного массива чисел с плавающей запятой двойной точности (8 байт на
оценка) в файл . Такие программы, как Easel's ESL-хистплот может читать такие двоичные файлы.
Это полезно при генерации очень больших размеров выборки.

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ УПРАВЛЕНИЕ МОДЕЛЬ КОНФИГУРАЦИЯ (РЕЖИМ)


H3 использует только локальное выравнивание с несколькими ударами ( --fs режим), и именно здесь мы считаем
статистические соответствия. Оценка местного соответствия Unihit (Смит / Уотерман; --sw режим) также подчиняться нашим
статистические домыслы. Статистика глокального выравнивания (multihit или unihit)
все еще недостаточно изучен и должным образом не установлен.

--fs Собирайте множественные локальные оценки выравнивания. Это значение по умолчанию. выравнивание как
'режим поиска фрагментов'.

--sw Собирайте локальные оценки unihit. Состояние H3 J отключено. выравнивание как
«Режим поиска Смита / Уотермана».

--ls Соберите множественные оценки глокального выравнивания. При глокальном (глобальном / локальном) выравнивании
вся модель должна быть согласована с подпоследовательностью цели. Местный вход / выход H3
вероятности перехода отключены. 'ls' происходит от исторического
терминология для множественного локального выравнивания как «режим локального поиска».

--с Собирайте оценки глокального выравнивания unihit. И состояние H3 J, и местный вход / выход
вероятности перехода отключены. 's' происходит от исторического
терминология для глокального выравнивания unihit.

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ УПРАВЛЕНИЕ ОЦЕНКА ALGORITHM / АЛГОРИТМ


--вит Соберите оценки максимального правдоподобия Витерби. Это значение по умолчанию.

--вперед Соберите оценки вероятности форвардных логарифмов, суммированные по ансамблю сопоставлений.

--гиб Собирайте баллы «Гибрид», как описано в статьях Ю и Хва (например,
Биоинформатика 18: 864, 2002). Они включают в себя вычисление прямой матрицы и принятие
максимальное значение ячейки. Само число статистически несколько немотивировано,
но ожидается, что распределение будет хорошим распределением экстремальных значений
(Гамбель).

--msv Соберите оценки MSV (несколько незаполненных сегментов Витерби), используя основной
эвристика ускорения.

--быстро Для любого из вышеперечисленных вариантов используйте оптимизированную производственную реализацию H3 (используя
SIMD-векторизация). По умолчанию используется реализация, приносящая в жертву небольшую
количество числовой точности. Это может внести мешающий шум в
статистическое моделирование и подгонки, поэтому, когда кто-то слишком беспокоится о точном
детали, лучше уметь исключить этот источник шума.

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ УПРАВЛЕНИЕ УСТАНОВЛЕНЫ ХВОСТ МАССЫ Для FORWARD


В некоторых экспериментах было полезно подогнать форвардные оценки к диапазону различных хвостов.
масс, а не одной. Эти опции обеспечивают механизм для установки равномерного
разнесенный диапазон разных масс хвоста. Для каждой разной массы хвоста создается линия
на выходе.

--tмин
Установите нижнюю границу распределения массы хвоста. (По умолчанию для
масса одного хвостового оперения по умолчанию.)

--tmax
Установите верхнюю границу распределения массы хвоста. (По умолчанию для
масса одного хвостового оперения по умолчанию.)

--tpoints
Установите количество хвостовых масс для выборки, начиная с --tмин и заканчивается в --tmax.
(Значение по умолчанию - 1, для массы одного хвостового оперения по умолчанию - 0.02).

- линейный
Выполните выборку ряда масс хвоста с равномерным линейным шагом. По умолчанию используется
равномерный логарифмический интервал.

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ УПРАВЛЕНИЕ H3 ПАРАМЕТР ПРЕДВАРИТЕЛЬНЫЙ РАСЧЕТ МЕТОДЫ


H3 использует три коротких моделирования случайной последовательности для оценки параметров местоположения для
ожидаемое распределение оценок для оценок MSV, оценок Витерби и оценок вперед. Эти
опции позволяют изменять эти симуляции.

- ЭмЛ
Устанавливает длину последовательности в моделировании, которая оценивает параметр местоположения mu для
MSV E-ценности. По умолчанию 200.

--ЭмН
Устанавливает количество последовательностей в моделировании, которое оценивает параметр местоположения mu
для MSV E-values. По умолчанию 200.

--EvL
Устанавливает длину последовательности в моделировании, которая оценивает параметр местоположения mu для
Электронные ценности Витерби. По умолчанию 200.

--ЭвН
Устанавливает количество последовательностей в моделировании, которое оценивает параметр местоположения mu
для значений Е Витерби. По умолчанию 200.

--ЭфЛ
Устанавливает длину последовательности при моделировании, которая оценивает параметр местоположения tau
для форвардных E-значений. По умолчанию 100.

--ЭфН
Устанавливает количество последовательностей в моделировании, которое оценивает параметр местоположения
тау для форвардных E-значений. По умолчанию 200.

- Влево
Устанавливает массовую долю хвоста, чтобы соответствовать моделированию, которое оценивает местоположение
параметр tau для форвардных оценок. По умолчанию 0.04.

ОТЛАДКА ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


--ларек
Для отладки версии MPI master / worker: пауза после запуска, чтобы включить
разработчик, чтобы присоединить отладчики к запущенным основным и рабочим процессам. послать
SIGCONT сигнал для отмены паузы. (Под gdb: (GDB) сигнал СЛЕДУЮЩИЙ) (Только
доступно, если во время компиляции была включена дополнительная поддержка MPI.)

--семя
Установите начальное число случайных чисел на . По умолчанию 0, что делает случайное число
генератор использует произвольное начальное число, так что разные прогоны хммм будет почти
безусловно, генерируют другую статистическую выборку. Для отладки полезно
добиться воспроизводимых результатов, зафиксировав начальное число случайным образом.

ЭКСПЕРИМЕНТАЛЬНАЯ ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


Эти варианты использовались в небольшом количестве различных исследовательских экспериментов.

--bgквартира
Установите равномерное распределение фонового остатка как для
целей нулевой модели, используемой при подсчете баллов, и для генерации
случайные последовательности. По умолчанию используется стандартная частота аминокислотного фона.
распределение.

--bgcomp
Установите распределение остатков фона равным среднему составу профиля.
Это было использовано при изучении некоторых эффектов искаженной композиции.

--x-без длины модели
Выключите модель длины целевой последовательности H3. Установите самопереходы для N, C, J
а для нулевой модели - 350/351; это имитирует HMMER2. Не лучшая идея в
Общее. Это было использовано для демонстрации одного из основных отличий H2 от H3.

--ну
Установите параметр nu для алгоритма MSV - ожидаемое количество незащищенных локальных
выравниваний на последовательность-мишень. По умолчанию 2.0, что соответствует E-> J.
вероятность перехода 0.5. Это использовалось, чтобы проверить, есть ли у различных nu
существенное влияние на результат (не кажется, в пределах разумного). Только этот вариант
работает, если --msv выбран (влияет только на MSV) и не будет работать с --быстро
(потому что оптимизированные реализации зашиты так, чтобы предполагать nu = 2.0).

--ptresh
Установите пороговое значение P-значения фильтра для использования при создании файлов мощности фильтра с
--файл. По умолчанию - 0.02 (что подходит для тестирования оценок MSV,
поскольку это порог фильтра MSV по умолчанию в конвейере ускорения H3.)
Другие подходящие варианты (соответствующие значениям по умолчанию в конвейере ускорения) будут
0.001 для Витерби и 1e-5 для форварда.

Используйте hmmsim онлайн с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

Команды Linux

Ad