англійськафранцузькаіспанська

Ad


Значок OnWorks

cmalign - онлайн у хмарі

Запустіть cmalign у постачальника безкоштовного хостингу OnWorks через Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

Це команда cmalign, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS.

ПРОГРАМА:

ІМ'Я


cmalign - вирівняти послідовності за коваріаційною моделлю

СИНТАКСИС


cmalign
[параметри]

ОПИС


cmalign вирівнює послідовності РНК в до коваріаційної моделі (CM) в .
Нове вирівнювання виводиться до stdout у форматі Стокгольм, але його можна перенаправити у файл
з -o варіант.

Або or (але не обидва) може бути "-" (тире), що означає читання цього
вхід з stdin а не файл.

Файл послідовності має бути у форматі FASTA або Genbank.

cmalign використовує техніку смуги HMM для прискорення вирівнювання за замовчуванням, як описано
нижче для --hbanded варіант. Струювання HMM можна вимкнути за допомогою --безсмуговий варіант.

За замовчуванням cmalign обчислює вирівнювання з максимальною очікуваною точністю, тобто
узгоджується з обмеженнями (смугами), отриманими з HMM, з використанням смугової версії
Алгоритм оптимальної точності Дурбіна/Холмса. Цю поведінку можна змінити за допомогою --cyk or
--зразок Варіанти.

cmalign приділяє особливу увагу правильному вирівнюванню усічених послідовностей, де деякі нуклеотиди
від початку (5') та/або кінця (3') фактичної повної біологічної послідовності
відсутній у вхідній послідовності (див. DL Kolbe and SR Eddy, Bioinformatics, 25:1236-1243,
2009). Ця поведінка ввімкнена за замовчуванням, але її можна вимкнути за допомогою --notrunc. У попередньому
версії cmalign --суб необхідна була опція для належної обробки скороченого
послідовності. The --суб Опція все ще доступна в цій версії, але новий метод за замовчуванням
для обробки усічених послідовностей має бути таким же хорошим або перевершувати підметод майже
всі випадки.

Команда --мапалі Опція дозволяє включати фіксоване тренувальне вирівнювання, яке використовується для побудови
CM з файлу в межах вихідного вирівнювання cmalign.

За допомогою мольберта можна об’єднати два або більше вирівнювань, створених одним і тим же CM
міні-додаток esl-alimerge (входить до підкаталогу easel/miniapps/ Infernal). Попередній
версії cmalign включені варіанти об’єднання вирівнювань, але вони не рекомендовані
розвитку esl-alimerge, що значно ефективніше пам'яті.

За замовчуванням cmalign виведе вирівнювання до стандартного виведення. Вирівнювання можна перенаправити
у вихідний файл з -o варіант. З -о, інформацію про кожну вирівняну
послідовність, включаючи межі оцінки та вирівнювання моделі, буде надрукована в стандартний вивід (докладніше
про це нижче).

За замовчуванням вихідне вирівнювання буде в стокгольмському форматі. Це можна змінити на Pfam,
вирівняти формат FASTA (AFA), A2M, Clustal або Phylip за допомогою --формат варіант
де це назва потрібного формату. Як окремий випадок, якщо вихідне вирівнювання
є більшим (більше 10,000 10,000,000 послідовностей або понад XNUMX XNUMX XNUMX загальних нуклеотидів), ніж
вихідний формат буде форматом Pfam, причому кожна послідовність відображатиметься в одному рядку, for
причини ефективності пам'яті. Для вирівнювань, більших за це, скористайтеся --звільнений змусить
чергування стокгольмського формату, але користувач повинен знати, що для цього може знадобитися багато
пам'ять. --звільнений працюватиме лише для вирівнювань до 100,000 100,000,000 послідовностей або XNUMX XNUMX XNUMX
загальні нуклеотиди.

Якщо вихідний формат вирівнювання – Stockholm або Pfam, вихідне вирівнювання буде таким
анотовані апостеріорними ймовірностями, які оцінюють рівень довіри кожного вирівняного
нуклеотид. Ця анотація відображається у вигляді рядків, які починаються на "#=GR ПП», один о
послідовність, кожна безпосередньо під відповідною вирівняною послідовністю " ".
Символи в рядках PP мають 12 можливих значень: «0-9», «*» або «.». Якщо ".", позиція
відповідає пробілу в послідовності. Значення "0" вказує на апостеріорну ймовірність
від 0.0 до 0.05, «1» означає від 0.05 до 0.15, «2» означає від 0.15 до
0.25 і так далі до "9", що означає від 0.85 до 0.95. Значення "*" вказує на a
апостеріорна ймовірність від 0.95 до 1.0. Вищі апостеріорні ймовірності відповідають
для більшої впевненості, що вирівняний нуклеотид належить тому місці, де він з’являється в
вирівнювання. З --безсмуговий, розрахунок апостеріорних ймовірностей враховує все
можливе вирівнювання цільової послідовності до CM. Без --безсмуговий (тобто за замовчуванням
режим), розрахунок враховує лише можливі вирівнювання в межах діапазонів HMM. далі,
апостеріорні ймовірності залежать від режиму усічення вирівнювання. Для
наприклад, якщо вирівнювання послідовності скорочено на 5', значення PP "9" вказує між
0.85 і 0.95 з усіх 5'-урізаних вирівнювань включають даний нуклеотид у даному
позицію. Задню анотацію можна вимкнути за допомогою --без проблем варіант. Якщо --маленький
увімкнено, задню анотацію також потрібно вимкнути за допомогою --без проблем.

Табличний висновок, який друкується в стандартний вихід, якщо -o Використовується варіант включає один рядок
на послідовність і дванадцять полів на рядок: "idx": індекс послідовності у вхідних даних
file, "seq name": назва послідовності; «length»: довжина послідовності; «см від» і
«см до»: початкове та кінцеве положення моделі; "trunc": "ні", якщо послідовність
не обрізається, "5'", якщо початок послідовності скорочено 5', "3'", якщо кінець
послідовність скорочується, а "5'&3'", якщо обрізано і початок, і кінець;
"bit sc": бітовий бал вирівнювання, "avg pp" середня апостеріорна ймовірність
всі вирівняні нуклеотиди у вирівнюванні; "band calc", "alignment" і "total": час
за секунди, необхідні для розрахунку діапазонів HMM, обчислення вирівнювання та завершення
обробка послідовності відповідно; «mem (Mb)»: розмір у Мб усіх динамічних
матриці програмування, необхідні для вирівнювання послідовності. Ці табличні дані можна зберегти
подати з --файл варіант.

ВАРІАНТИ


-h Допомога; надрукувати коротке нагадування про використання командного рядка та доступні параметри.

-o Збережіть вирівнювання у форматі Стокгольм у файл . За замовчуванням це написати
на стандартний вихід.

-g Налаштуйте модель для глобального вирівнювання моделі запиту до цілі
послідовності. За замовчуванням модель налаштована на локальне вирівнювання. Місцеві
вирівнювання можуть містити великі вставки та видалення, які називаються "локальними кінцями" в
структура повинна бути покарана інакше, ніж звичайні індели. Вони позначаються як
"~" у рядку RF вихідного вирівнювання. The -g опцію можна використовувати для
заборонити ці локальні цілі. The -g опція необхідна, якщо --суб варіант також є
використаний

ВАРІАНТИ ДЛЯ КОНТРОЛЬ THE ЗАЛИШКА АЛГОРИТМ


--optacc
Вирівняйте послідовності за допомогою алгоритму оптимальної точності Дурбіна/Холмса. Це
за замовчуванням. Оптимальне вирівнювання точності буде обмежено смугами HMM для
прискорення, якщо не --безсмуговий опція увімкнена. Оптимальна точність
Алгоритм визначає вирівнювання, яке максимізує апостеріорні ймовірності
вирівняні нуклеотиди всередині нього. Апостеріорні ймовірності визначають за допомогою
(можливо, HMM-смуговий) варіанти внутрішніх і зовнішніх алгоритмів.

--cyk Не використовуйте вирівнювання оптимальної точності Дурбіна/Холмса для вирівнювання послідовностей,
замість цього використовуйте алгоритм CYK, який визначає оптимальний бал (максимальний
ймовірність) вирівнювання послідовності до моделі, враховуючи діапазони HMM (якщо
--безсмуговий також увімкнено).

--зразок
Зразок вирівнювання із заднього розподілу вирівнювань. Задній
розподіл визначається за допомогою смуги HMM (якщо --безсмуговий) варіант
Внутрішній алгоритм.

--насіння
Заповніть генератор випадкових чисел за допомогою , ціле число >= 0. Ця опція може лише
використовувати в поєднанні з --зразок. If є відмінним від нуля, стохастична вибірка
вирівнювання будуть відтворюваними; та сама команда дасть ті самі результати. Якщо
дорівнює 0, генератор випадкових чисел засівається довільно і стохастичний
вибірки можуть відрізнятися від виконання до виконання однієї і тієї ж команди. За замовчуванням початкове значення дорівнює 181.

--notrunc
Вимкніть усічені алгоритми вирівнювання. Усі послідовності у вхідному файлі будуть
вважається повною довжиною, якщо --суб також використовується, і в цьому випадку програма може
як і раніше обробляти усічені послідовності, але використовуватиме альтернативну стратегію для їх
вирівнювання.

--суб Увімкніть процедуру побудови та вирівнювання підмоделі. Для кожної послідовності an
HMM спочатку використовується для прогнозування початкових і кінцевих стовпців консенсусу моделі, а також новий
sub CM сконструйовано так, що моделює лише стовпці консенсусу від початку до кінця. The
потім послідовність вирівнюється з цією підсистемою CM. Підвирівнювання є старішим методом, ніж метод
за замовчуванням для вирівнювання послідовностей, які, можливо, скорочені. За замовчуванням, cmalign
використовує спеціальні алгоритми DP для обробки усічених послідовностей, яких має бути більше
у більшості випадків точніше, ніж підметод. --суб все ще включено як опція
в основному для тестування щодо цієї обробки урізаної послідовності за замовчуванням. Цей "суб CM"
Процедура не така сама, як «підрядні CM», описані Вайнбергом і Руццо.

ВАРІАНТИ ДЛЯ КОНТРОЛЬ ШВИДКІСТЬ І ПАМ'ЯТЬ ВИМОГИ


--hbanded
Цей параметр увімкнено за замовчуванням. Прискоріть вирівнювання, обрізаючи області
матриці CM DP, які HMM вважає незначними. По-перше, кожна послідовність є
оцінка за допомогою плану CM 9 HMM, отриманого від CM за допомогою прямого та зворотного HMM
алгоритми для обчислення апостеріорних ймовірностей того, що кожен нуклеотид вирівняється з кожним
стан HMM. Ці апостеріорні ймовірності використовуються для виведення обмежень
(смуги) на матриці CM DP. Нарешті, цільова послідовність вирівнюється до CM
з використанням смугастої матриці DP, під час якої клітинки за межами смуг ігноруються.
Зазвичай більша частина повної матриці DP лежить за межами смуг (часто більше 95%),
зробити цю техніку швидшою, тому що потрібно менше обчислень DP і більше
ефективна пам’ять, оскільки потрібно виділяти лише клітинки всередині діапазонів.

Важливо, що смуги HMM жертвують гарантією визначення оптимального
точне або оптимальне вирівнювання, яке буде упущено, якщо воно лежить за межами смуг.
Параметр tau — це кількість ймовірної маси, яка вважається незначною протягом
Розрахунок діапазону HMM; нижчі значення тау дають більші прискорення, але також і більші
ймовірність пропустити оптимальне вирівнювання. Тау за замовчуванням — 1E-7, визначено
емпірично як хороший компроміс між чутливістю та швидкістю, хоча це значення може
змінюватися за допомогою --тау варіант. Рівень прискорення зростає з
як довжина, так і рівень збереження первинної послідовності сімейства. Наприклад,
зі стандартним tau 1E-7, моделями тРНК (низьке збереження первинної послідовності с
довжиною близько 75 нуклеотидів) демонструють приблизно 10-кратне прискорення, а бактеріальна рРНК SSU
моделі (високе збереження первинної послідовності з довжиною близько 1500 нуклеотидів)
показати приблизно 700X. Струювання HMM можна вимкнути за допомогою --безсмуговий варіант.

--тау
Встановіть ймовірність втрати хвоста, яка використовується під час обчислення смуги HMM . Це
кількість маси ймовірності в межах апостеріорних ймовірностей HMM, тобто
вважається незначним. Значення за замовчуванням – 1E-7. Загалом, вищі значення будуть
призводять до більшого прискорення, але збільшують ймовірність пропустити оптимальне
вирівнювання за рахунок смуг HMM.

--mxsize
Встановіть максимально допустимий загальний розмір матриці DP мегабайти. За замовчуванням це
Розмір 1028 Мб. Це повинно бути достатньо великим для переважної більшості вирівнювань,
однак якщо це не так cmalign спробує ітеративно підтягнути смуги HMM
використовує для обмеження вирівнювання шляхом підвищення параметра tau і перерахунку
смуг, поки загальний необхідний розмір матриці не впаде нижче мегабайт або максимум
допустиме значення tau (0.05 за замовчуванням, але можна змінити за допомогою --maxtau) досягнуто. В
кожна ітерація затягування смуги, tau множиться на 2.0. Затягування смуги
стратегію можна вимкнути за допомогою --fixedtau варіант. Якщо максимальний тау дорівнює
досягнуто, а необхідний розмір матриці все ще перевищує або якщо смуги HMM не є
використовується, а необхідний розмір матриці перевищує потім cmalign вийде
передчасно та повідомити про помилку, що матриця перевищила свій максимум
допустимий розмір. У цьому випадку, --mxsize можна використовувати для збільшення обмеження розміру або
максимальний тау можна підняти за допомогою --maxtau. Ліміт зазвичай буде перевищено
коли --безсмуговий Опція використовується без --маленький варіант, але все ще може виникнути
коли --безсмуговий не використовується. Зверніть увагу, що якщо cmalign обкатується множинний
потоків на багатоядерній машині, то кожен потік може мати виділену матрицю up
за розміром Мб у будь-який момент часу.

--fixedtau
Вимкніть стратегію затягування смуги HMM, описану в поясненні до
--mxsize варіант вище.

--maxtau
Встановіть максимально допустиме значення тау під час затягування стрічки, описане в
пояснення --mxsize вище, до . За замовчуванням це значення дорівнює 0.05.

--безсмуговий
Вимикає смуги HMM. Повернене вирівнювання гарантовано буде глобальним
оптимально точний (за замовчуванням) або глобально оптимальний бал (якщо --cyk
увімкнено). The --маленький варіант рекомендується в поєднанні з цим варіантом,
оскільки стандартне вирівнювання без смуг HMM вимагає багато пам’яті (див
--маленький ).

--маленький
Використовуйте алгоритм вирівнювання CYK «розділяй і володарюй», описаний у SR Eddy, BMC
Біоінформатика 3:18, 2002 --безсмуговий Опція повинна використовуватися в поєднанні з
ці параметри. Крім того, це рекомендується завжди --безсмуговий використовується це --маленький is
також використовується, оскільки стандартне вирівнювання CM без смуг HMM вимагає багато
пам'ять, особливо для великих РНК. --маленький дозволяє CM вирівнювання в межах практичного
обмеження пам'яті, що зменшує пам'ять, необхідну для вирівнювання LSU рРНК, найбільшої
відомі РНК, від 150 Гб до менше 300 Мб. Цей параметр можна використовувати тільки в
поєднання з --безсмуговий, --notrunc, та --cyk.

ДОДАТКОВО ВИХІД ФАЙЛИ


--файл
Звантажуйте оцінку вирівнювання за послідовність та інформацію про час у файл . Формат
цей файл описаний вище (це ті самі дані в тому ж форматі, що і табличний
stdout вихід, коли -o використовується варіант).

--tfile
Дамп табличної послідовності для кожної окремої послідовності до файлу .
Насамперед корисний для налагодження.

--file
Звантажуйте інформацію про вставку послідовності у файл . Формат файлу такий
описується рядками коментарів із префіксом "#", включеними у верхній частині файлу . Команда
Вставна інформація є дійсною, навіть якщо --тільки порівну використовується варіант.

--elfile
Дампувати стан EL для послідовності (локальний кінець) вставити інформацію до файлу . Формат
файлу описується рядками коментарів із префіксом "#", включеними у верхній частині файлу
файл . Інформація вставки EL є дійсною, навіть якщо --тільки порівну опція
використаний

ІНШІ ВАРІАНТИ


--мапалі
Читає вирівнювання з файлу використаний для побудови моделі, вирівнює її як єдину
заперечувати до CM; наприклад, вирівнювання в утримується фіксованим. Це дозволяє вам
вирівняти послідовності за моделлю з cmalign і розглядати їх у контексті існуючого
надійне множинне вирівнювання. має бути файлом вирівнювання, який був створений CM
від Програма перевіряє, що контрольна сума файлу відповідає сумі файлу
використовується для побудови CM. Такий варіант був названий --withali in
попередні версії cmalign.

--mapstr
Необхідно використовувати в поєднанні з --мапалі . Поширюйте структурну інформацію
для будь-яких псевдовузлів, які існують в на вихідне вирівнювання. Подібний варіант до
цього називали --withstr у попередніх версіях cmalign.

--інформація
Стверджують, що введення є у форматі . Не запускайте формат Babelfish
автовизначення. Це дещо підвищує надійність програми, тому що
Babelfish може робити помилки; особливо рекомендується для безнаглядних, високо-
пропускна здатність запусків Infernal. Допустимі формати: FASTA, GENBANK і DDBJ.
нечутливий до регістру.

--формат
Вкажіть вихідний формат вирівнювання як . Допустимі формати: Pfam, AFA,
A2M, Clustal і Phylip. AFA вирівнюється швидко. Лише вирівнювання Pfam і Stockholm
формати включатимуть анотацію консенсусної структури та апостеріорну ймовірність
анотація вирівняних залишків.

--dnaout
Виведіть вирівнювання як вирівнювання послідовності ДНК, а не РНК.

--без проблем
Не коментуйте вихідне вирівнювання апостеріорними ймовірностями.

--тільки порівну
У вихідне вирівнювання включати лише стовпці відповідності, не включати жодних вставок
відносно моделі консенсусу. Ця опція може бути корисною при створенні дуже великих розмірів
вирівнювання, які вимагають багато пам’яті та місця на диску, більшість з яких необхідна
лише для роботи зі вставними стовпцями, які є пробілами в більшості послідовностей.

--звільнений
Виведіть вирівнювання у форматі Стокгольм із чергуванням із фіксованою шириною, яка може бути
зручніше для обстеження. Це був вихідний формат вирівнювання за замовчуванням
попередні версії cmalign. Зверніть увагу, що cmalign при цьому потрібно більше пам’яті
використовується варіант. З цієї причини, --звільнений працюватиме лише для вирівнювань до
100,000 100,000,000 послідовностей або загалом XNUMX XNUMX XNUMX вирівняних нуклеотидів.

--регрес
Збережіть додаткову копію вихідного вирівнювання без інформації про автора у файл
.

-багатослівний
Вивести додаткову інформацію в табличні результати (виведення в стандартний виведення if -o
використовується, або до if --файл використовується). Вони в основному корисні для тестування та
налагодження.

--ЦП
Вкажіть це використовувати паралельні працівники ЦП. Якщо встановлюється як "0", то
програма буде запускатися в послідовному режимі, без використання потоків. Ви також можете контролювати
це число шляхом встановлення змінної середовища, INFERNAL_NCPU. Цей варіант буде
бути доступним лише в тому випадку, якщо машина, на якій було побудовано Infernal, здатна використовувати
POSIX threading (докладніше дивіться в розділі «Встановлення» посібника користувача
інформація).

--mpi Запустити як паралельну програму MPI. Ця опція буде доступна лише за наявності у Infernal
було налаштовано та створено з прапором «--enable-mpi» (див. інсталяцію
розділ посібника користувача для отримання додаткової інформації).

Використовуйте cmalign онлайн за допомогою служб onworks.net


Безкоштовні сервери та робочі станції

Завантажте програми для Windows і Linux

  • 1
    Alt-F
    Alt-F
    Alt-F надає безкоштовний і відкритий вихідний код
    альтернативне програмне забезпечення для DLINK
    DNS-320/320L/321/323/325/327L and
    ДНР-322Л. Alt-F має Samba і NFS;
    підтримує ext2/3/4...
    Завантажити Alt-F
  • 2
    usm
    usm
    Usm — це уніфікований пакет slackware
    менеджер, який обробляє автоматичну роботу
    вирішення залежностей. Це об’єднує
    різні сховища пакетів, в т.ч
    slackware, slacky, p...
    Завантажити usm
  • 3
    Chart.js
    Chart.js
    Chart.js — це бібліотека Javascript, яка
    дозволяє дизайнерам і розробникам малювати
    всілякі діаграми з використанням HTML5
    елемент полотна. Chart js пропонує чудові можливості
    масив ...
    Завантажте Chart.js
  • 4
    iReport-Designer для JasperReports
    iReport-Designer для JasperReports
    ПРИМІТКА. Підтримка iReport/Jaspersoft Studio
    Оголошення: починаючи з версії 5.5.0,
    Офіційною буде студія Jaspersoft
    дизайн клієнта для JasperReports. iReport
    буде ...
    Завантажте iReport-Designer для JasperReports
  • 5
    PostInstallerF
    PostInstallerF
    PostInstallerF встановить усі файли
    програмне забезпечення, яке Fedora Linux та інші
    не включає за замовчуванням після
    запуск Fedora вперше. Його
    легко для ...
    Завантажте PostInstallerF
  • 6
    страйк
    страйк
    Проект strace перенесено в
    https://strace.io. strace is a
    діагностика, налагодження та інструктаж
    трасування простору користувача для Linux. Його використовують
    стежити за...
    Завантажити strace
  • Детальніше »

Команди Linux

Ad