АнглийскийФранцузскийИспанский

Ad


Значок OnWorks

cmalign - Онлайн в облаке

Запустите cmalign в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда cmalign, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


cmalign - выравнивает последовательности по ковариационной модели

СИНТАКСИС


cmalign
[опции]

ОПИСАНИЕ


cmalign выравнивает последовательности РНК в к ковариационной модели (CM) в .
Новое выравнивание выводится в стандартный вывод в Стокгольмском формате, но может быть перенаправлен в файл
с -o опцию.

Или or (но не оба) могут быть '-' (тире), что означает чтение этого
ввод от STDIN а не файл.

Файл последовательности должен быть в формате FASTA или Genbank.

cmalign по умолчанию использует технику полос HMM для ускорения выравнивания, как описано
ниже для --hbandded вариант. Бандинг HMM можно отключить с помощью - без полос опцию.

По умолчанию cmalign вычисляет выравнивание с максимальной ожидаемой точностью, т.е.
в соответствии с ограничениями (полосами), полученными из HMM, с использованием полосатой версии
Алгоритм оптимальной точности Дурбина / Холмса. Это поведение можно изменить с помощью --cyk or
--образец настройки.

cmalign уделяет особое внимание правильному выравниванию усеченных последовательностей, в которых некоторые нуклеотиды
от начала (5 ') и / или конца (3') фактической полноразмерной биологической последовательности
отсутствует во входной последовательности (см. DL Kolbe and SR Eddy, Bioinformatics, 25: 1236-1243,
2009 г.). Это поведение включено по умолчанию, но его можно отключить с помощью --notrunc. В предыдущем
версии cmalign домен --sub опция была необходима для надлежащей обработки усеченного
последовательности. --sub опция по-прежнему доступна в этой версии, но новый метод по умолчанию
для обработки усеченных последовательностей должен быть так же хорош или лучше, чем метод sub почти в
все дела.

Ассоциация --мапали опция позволяет включить фиксированное выравнивание обучения, используемое для построения
CM из файла в пределах выходного выравнивания смвыравнивание.

Можно объединить два или более выравнивания, созданных одним и тем же CM, используя Easel.
MiniApp эсл-алимерге (находится в подкаталоге / miniapps / Infernal). Предыдущий
версии cmalign включены опции для объединения выравниваний, но они устарели после
развитие эсл-алимерге, что значительно эффективнее с точки зрения памяти.

По умолчанию cmalign выведет выравнивание на стандартный вывод. Выравнивание можно перенаправить
в выходной файл с -o вариант. С участием -о, информация по каждому согласованному
последовательность, включая оценку и границы выравнивания модели, будет напечатана в стандартный вывод (подробнее
об этом ниже).

По умолчанию выходное выравнивание будет в Стокгольмском формате. Это можно изменить на Pfam,
выровненный формат FASTA (AFA), A2M, Clustal или Phylip с использованием - форматировать вариант,
в котором это имя желаемого формата. Как особый случай, если выходное выравнивание
большой (более 10,000 10,000,000 последовательностей или более XNUMX XNUMX XNUMX общих нуклеотидов), чем
выходной формат будет форматом Pfam, где каждая последовательность будет отображаться в отдельной строке, для
причины эффективности памяти. Для выравниваний большего размера используйте --leaved заставит
чередующийся стокгольмский формат, но пользователь должен знать, что для этого может потребоваться много
Память. --leaved будет работать только для выравниваний до 100,000 последовательностей или 100,000,000
общие нуклеотиды.

Если выходным форматом выравнивания является Стокгольм или Pfam, выходное выравнивание будет
аннотированы апостериорными вероятностями, которые оценивают уровень достоверности каждого выровненного
нуклеотид. Эта аннотация отображается в виде строк, начинающихся с "# = GR ПП », по одному на
последовательность, каждая непосредственно под соответствующей выровненной последовательностью " ".
Символы в строках PP имеют 12 возможных значений: «0–9», «*» или «.». Если ".", Позиция
соответствует разрыву в последовательности. Значение «0» указывает апостериорную вероятность
от 0.0 до 0.05, «1» означает от 0.05 до 0.15, «2» означает от 0.15 до
0.25 и так далее до «9», что означает от 0.85 до 0.95. Значение «*» указывает на
апостериорная вероятность от 0.95 до 1.0. Более высокие апостериорные вероятности соответствуют
для большей уверенности в том, что выровненный нуклеотид принадлежит там, где он появляется в
выравнивание. С участием - без полос, при вычислении апостериорных вероятностей учитываются все
возможные выравнивания целевой последовательности по CM. Без - без полос (т.е. по умолчанию
режим), расчет учитывает только возможные выравнивания в пределах диапазонов HMM. Дальше,
апостериорные вероятности зависят от режима усечения выравнивания. За
Например, если выравнивание последовательности усечено на 5 ', значение PP «9» указывает между
0.85 и 0.95 всех 5'-усеченных выравниваний включают данный нуклеотид в данной
должность. Заднюю аннотацию можно отключить с помощью --нет проблем вариант. Если --небольшой
включен, задняя аннотация также должна быть отключена с помощью --нет проблем.

Табличный вывод, который выводится на стандартный вывод, если -o опция используется включает одну строку
на последовательность и двенадцать полей в строке: "idx": индекс последовательности во входных данных.
файл, "seq name": имя последовательности; «длина»: длина последовательности; "см от" и
«см до»: начальная и конечная позиции модели для выравнивания; "trunc": "no", если последовательность
не усекается, «5 '», если начало последовательности усечено на 5', «3 '», если конец
последовательность усекается, и «5 '& 3'», если и начало, и конец усекаются;
"bit sc": битовая оценка выравнивания, "avg pp" средняя апостериорная вероятность
все выровненные нуклеотиды в выравнивании; "band calc", "alignment" и "total": время
в секундах, необходимых для расчета полос HMM, вычисления выравнивания и завершения
обработка последовательности соответственно; "mem (Мб)": размер в Мб всего динамического
программирование матриц, необходимых для выравнивания последовательности. Эти табличные данные могут быть сохранены
подать с --sfile опцию.

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


-h Помощь; напечатайте краткое напоминание об использовании командной строки и доступных параметрах.

-o Сохраните трассу в Стокгольмском формате в файл. . По умолчанию это пишется
на стандартный вывод.

-g Настройте модель для глобального согласования модели запроса с целью
последовательности. По умолчанию модель настроена на локальное выравнивание. Местный
выравнивания могут содержать большие вставки и удаления, называемые "локальными концами" в
структура будет наказываться иначе, чем обычные инделки. Они помечены как
Столбцы "~" в строке RF выходного выравнивания. В -g вариант может быть использован для
запретить эти местные цели. В -g опция требуется, если --sub вариант также
используемый.

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ Для УПРАВЛЕНИЕ ВЫРАВНИВАНИЕ ALGORITHM / АЛГОРИТМ


--optacc
Выровняйте последовательности с помощью алгоритма оптимальной точности Дарбина / Холмса. Это
дефолт. Оптимальная точность выравнивания будет ограничена полосами HMM для
ускорение, если только - без полос опция включена. Оптимальная точность
алгоритм определяет выравнивание, которое максимизирует апостериорные вероятности
выровненные нуклеотиды внутри него. Апостериорные вероятности определяются с использованием
(возможно, с полосами HMM) варианты алгоритмов Inside и Outside.

--cyk Не используйте выравнивание оптимальной точности Дарбина / Холмса для выравнивания последовательностей,
вместо этого используйте алгоритм CYK, который определяет оптимальную оценку (максимум
вероятность) выравнивание последовательности с моделью с учетом полос HMM (если
- без полос также включен).

--образец
Взять образец совмещения из апостериорного распределения совмещений. Задний
распределение определяется с использованием полосовой HMM (если - без полос) вариант
Внутренний алгоритм.

--семя
Заполните генератор случайных чисел , целое число> = 0. Этот параметр может только
использоваться в сочетании с --образец. If отличен от нуля, стохастическая выборка
выравнивания будут воспроизводимы; та же команда даст те же результаты. Если
равен 0, генератор случайных чисел заполняется произвольно, а стохастический
выборки могут отличаться от запуска к запуску одной и той же команды. Начальное число по умолчанию - 181.

--notrunc
Отключите усеченные алгоритмы выравнивания. Все последовательности во входном файле будут
предполагается полной длины, если только --sub также используется, и в этом случае программа может
по-прежнему обрабатывают усеченные последовательности, но будут использовать альтернативную стратегию для их
выравнивание.

--sub Включите процедуру построения и выравнивания подмодели. Для каждой последовательности
HMM сначала используется для прогнозирования начальных и конечных столбцов консенсуса модели, а новый
sub CM построен, который моделирует только согласованные столбцы от начала до конца. В
Затем последовательность выравнивается с этим вспомогательным CM. Дополнительное выравнивание - более старый метод, чем
значение по умолчанию для выравнивания последовательностей, которые могут быть усечены. По умолчанию, cmalign
использует специальные алгоритмы DP для обработки усеченных последовательностей, которые должны быть больше
в большинстве случаев точнее, чем метод sub. --sub все еще включен в качестве опции
в основном для тестирования этой обработки усеченной последовательности по умолчанию. Этот "дополнительный СМ"
процедура отличается от «вспомогательных CM», описанных Вайнбергом и Руццо.

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ Для УПРАВЛЕНИЕ СКОРОСТЬ И ПАМЯТЬ ТРЕБОВАНИЯ


--hbandded
По умолчанию эта опция включена. Ускорьте выравнивание, отсекая регионы
матрицы CM DP, которые HMM считает незначительными. Во-первых, каждая последовательность
забил с планом CM 9 HMM, полученным из CM с использованием прямого и обратного HMM
алгоритмы для расчета апостериорных вероятностей того, что каждый нуклеотид соответствует каждому
состояние HMM. Эти апостериорные вероятности используются для вывода ограничений
(полосы) на матрице CM DP. Наконец, целевая последовательность выравнивается по CM
используя полосатую матрицу DP, во время которой клетки вне полос игнорируются.
Обычно большая часть полной матрицы DP лежит за пределами диапазонов (часто более 95%),
делая этот метод быстрее, потому что требуется меньше вычислений DP и больше
память эффективна, потому что нужно выделять только ячейки в пределах диапазонов.

Важно отметить, что полосатость HMM жертвует гарантией определения оптимального
точное или оптимальное выравнивание, которое будет упущено, если оно выходит за пределы диапазонов.
Параметр тау - это величина вероятностной массы, которая считается незначительной во время
Расчет диапазона HMM; более низкие значения тау дают большее ускорение, но также и большее
шанс пропустить оптимальное выравнивание. Тау по умолчанию - 1E-7, определяется
эмпирически как хороший компромисс между чувствительностью и скоростью, хотя это значение может
быть измененным с --тау вариант. Уровень ускорения увеличивается с увеличением
как длина, так и уровень сохранности первичной последовательности в семействе. Например,
с тау по умолчанию 1E-7, модели тРНК (низкая консервация первичной последовательности с
длиной около 75 нуклеотидов) показывают примерно 10-кратное ускорение, а бактериальная рРНК SSU
модели (высокая консервативность первичной последовательности с длиной около 1500 нуклеотидов)
покажите около 700X. Бандинг HMM можно отключить с помощью - без полос опцию.

--тау
Установите вероятность потери хвоста, используемую при расчете полосы HMM, на . Это
величина вероятностной массы в пределах апостериорных вероятностей HMM, которая
считается незначительным. Значение по умолчанию - 1E-7. Как правило, более высокие значения будут
приводят к большему ускорению, но увеличивают вероятность пропуска оптимального
выравнивание за счет полос HMM.

--mxsize
Установите максимально допустимый общий размер матрицы DP равным мегабайты. По умолчанию это
размер 1028 Мб. Этого должно быть достаточно для подавляющего большинства выравниваний,
однако, если это не так cmalign попытается итеративно затянуть ленты HMM,
используется для ограничения выравнивания путем увеличения параметра тау и пересчета
полосы до тех пор, пока общий размер необходимой матрицы не станет ниже мегабайты или максимум
допустимое значение тау (по умолчанию 0.05, но можно изменить с помощью --макстау) достигается. В
на каждой итерации затягивания ленты tau умножается на 2.0. Ремешок затягивается
стратегию можно отключить с помощью --фикседтау вариант. Если максимальный тау равен
достигнута, а требуемый размер матрицы по-прежнему превышает или если полосатость HMM не
используется и требуемый размер матрицы превышает тогда cmalign выйдет
преждевременно и сообщить об ошибке, что матрица превысила свой максимум
допустимый размер. В этом случае --mxsize можно использовать для увеличения предела размера или
максимальный тау можно поднять с --махтау. Лимит обычно будет превышен
когда окно - без полос опция используется без --небольшой вариант, но все же может произойти
когда - без полос не используется. Обратите внимание, что если cmalign вбегается с разными
потоков на многоядерной машине, то каждому потоку может быть назначена матрица размером до
по размеру МБ в любой момент времени.

--фикседтау
Отключите стратегию затяжки ленты HMM, описанную в объяснении
--mxsize вариант выше.

--maxtau
Установите максимально допустимое значение тау во время затягивания ленты, как описано в
объяснение --mxsize выше, чтобы . По умолчанию это значение 0.05.

- без полос
Отключает бандинг HMM. Возвращаемое выравнивание гарантированно будет глобальным.
оптимально точный (по умолчанию) или глобально оптимально оцениваемый (если --cyk
включен). В --небольшой вариант рекомендуется в сочетании с этим вариантом,
потому что стандартное выравнивание без полос HMM требует много памяти (см.
--небольшой ).

--небольшой
Используйте алгоритм выравнивания CYK «разделяй и властвуй», описанный в SR Eddy, BMC.
Биоинформатика 3:18, 2002. The - без полос опция должна использоваться в сочетании с
это варианты. Кроме того, рекомендуется всякий раз, когда - без полос используется, что --небольшой is
также используется, потому что стандартное выравнивание CM без полос HMM требует много
память, особенно для больших РНК. --небольшой позволяет выравнивать CM в рамках практического
ограничения памяти, уменьшающие объем памяти, необходимый для выравнивания рРНК LSU, самого большого
известные РНК от 150 Гб до менее 300 Мб. Этот параметр можно использовать только в
сочетание с - без полос, --notrunc, и - cyk.

ДОПОЛНИТЕЛЬНО ВЫВОД FILES


--sfile
Выгрузить оценку выравнивания последовательности и информацию о времени в файл . Формат
этот файл описан выше (это те же данные в том же формате, что и табличный
вывод stdout, когда -o вариант).

--tfile
Дамп табличных трассировок последовательностей для каждой отдельной последовательности в файл .
В первую очередь полезно для отладки.

--ifile
Дампить информацию о вставке каждой последовательности в файл . Формат файла
описывается знаком "#" - строки комментариев с префиксом включаются в начало файла . Ассоциация
информация вставки действительна, даже если - только матч опция используется.

--elfile
Дамп состояния EL для каждой последовательности (локальный конец) вставить информацию в файл . Формат
файла описывается знаком "#" - строки комментариев с префиксом, включенные в начало
файл . Информация о вставке EL действительна, даже если - только матч опция
используемый.

ДРУГИЕ ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


--мапали
Читает выравнивание из файла используется для построения модели, выравнивает ее как единый
возразить в CM; например, выравнивание в фиксируется. Это позволяет вам
выровнять последовательности с моделью с cmalign и просматривать их в контексте существующего
доверенное множественное выравнивание. должен быть файл согласования, который был построен CM
от. Программа проверяет, что контрольная сумма файла совпадает с контрольной суммой файла.
используется для построения CM. Аналогичный вариант назывался --сали in
предыдущие версии смвыравнивание.

--mapstr
Должен использоваться в сочетании с --мапали . Распространять структурную информацию
для любых псевдоузлов, существующих в к выходному выравниванию. Аналогичный вариант на
этот назывался --withstr в предыдущих версиях смвыравнивание.

--информировать
Утверждают, что вход находится в формате . Не запускайте формат Babelfish
автоопределение. Это несколько увеличивает надежность программы, потому что
Вавилонская рыба может ошибаться; особенно рекомендуется для необслуживаемых, высокоэффективных
пропускная способность Infernal. Допустимые форматы: FASTA, GENBANK и DDBJ.
не учитывает регистр.

- форматировать
Укажите формат выравнивания вывода как . Допустимые форматы: Pfam, AFA,
A2M, Clustal и Phylip. AFA выровнен фаста. Только Pfam и выравнивание Стокгольма
форматы будут включать аннотацию структуры консенсуса и апостериорную вероятность
аннотация выровненных остатков.

--dnaout
Выведите выравнивания как выравнивания последовательностей ДНК, а не как выравнивания РНК.

--нет проблем
Не аннотируйте выходное выравнивание апостериорной вероятностью.

- только матч
Включайте только совпадающие столбцы в выходное выравнивание, не включайте никаких вставок
относительно модели консенсуса. Эта опция может быть полезна при создании очень больших
выравнивания, требующие много памяти и дискового пространства, большинство из которых необходимо
только для работы со вставляемыми столбцами, которые являются пробелами в большинстве последовательностей.

--leaved
Выведите выравнивание в чередующемся Стокгольмском формате фиксированной ширины, которая может быть
удобнее для осмотра. Это был формат выравнивания вывода по умолчанию для
предыдущие версии смвыравнивание. Обратите внимание, что cmalign требует больше памяти, когда это
опция используется. По этой причине, --leaved будет работать только для выравниваний до
100,000 последовательностей или всего 100,000,000 выровненных нуклеотидов.

--регресс
Сохраните дополнительную копию выходного выравнивания без информации об авторе в файл
.

--подробный
Вывести дополнительную информацию в табличный вывод результатов (вывод в стандартный вывод, если -o
используется, или if --sfile используется). Они в основном полезны для тестирования и
отладка.

--Процессор
Укажите, что параллельные рабочие процессоры. Если установлен как "0", тогда
программа будет работать в последовательном режиме, без использования потоков. Вы также можете контролировать
это число, установив переменную среды, ИНФЕРНАЛ_NCPU. Этот вариант будет
доступен только в том случае, если машина, на которой был построен Infernal, может использовать
POSIX threading (дополнительные сведения см. В разделе «Установка» руководства пользователя.
Информация).

--mpi Запускать как параллельную программу MPI. Эта опция будет доступна, только если у Infernal есть
был сконфигурирован и собран с флагом "--enable-mpi" (см. Установка
раздел руководства пользователя для получения дополнительной информации).

Используйте cmalign онлайн с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

  • 1
    Alt-F
    Alt-F
    Alt-F предоставляет бесплатный и открытый исходный код
    альтернативная прошивка для DLINK
    DNS-320/320L/321/323/325/327L and
    ДНР-322Л. Alt-F имеет Samba и NFS;
    поддерживает ext2 / 3/4 ...
    Скачать Alt-F
  • 2
    USM
    USM
    Usm — это унифицированный пакет slackware.
    менеджер, который занимается автоматическим
    разрешение зависимости. Он объединяет
    различные репозитории пакетов, включая
    slackware, slacky, р...
    Скачать УСМ
  • 3
    Chart.js
    Chart.js
    Chart.js — это библиотека Javascript, которая
    позволяет дизайнерам и разработчикам рисовать
    все виды диаграмм с использованием HTML5
    элемент полотна. Chart js предлагает отличный
    множество ...
    Скачать Chart.js
  • 4
    iReport-Designer для JasperReports
    iReport-Designer для JasperReports
    ПРИМЕЧАНИЕ. Поддержка iReport/Jaspersoft Studio.
    Объявление: Начиная с версии 5.5.0,
    Jaspersoft Studio станет официальным
    дизайнерский клиент для JasperReports. я докладываю
    воля...
    Скачать iReport-Designer для JasperReports
  • 5
    ПостустановщикF
    ПостустановщикF
    PostInstallerF установит все
    программное обеспечение, которое Fedora Linux и другие
    не включает по умолчанию, после
    запуск Fedora в первый раз. Его
    легко для ...
    Скачать PostInstallerF
  • 6
    Трассирование
    Трассирование
    Проект strace перенесен в
    https://strace.io. strace is a
    диагностика, отладка и обучение
    трассировщик пользовательского пространства для Linux. Это используется
    следить за...
    Скачать стрейс
  • Больше »

Команды Linux

Ad