АнглийскийФранцузскийНемецкийИтальянскийПортугальскийРусскийИспанский

Значок OnWorks

maq - Интернет в облаке

Запустите maq в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда maq, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


Maq - картографирование и качественная сборка

СИНТАКСИС


MAQ команду [опционы] Аргументы

maq.pl команду [опционы] Аргументы

ОПИСАНИЕ


Maq - это программное обеспечение, которое создает сборки сопоставления из коротких чтений, сгенерированных следующим:
генерация секвенсорных машин. Он специально разработан для Illumina-Solexa 1G Genetic
Analyzer и имеет предварительную функциональность для обработки данных AB SOLiD.

С помощью Maq вы можете:

· Быстрое совмещение считываний Illumina / SOLiD с эталонным геномом. С параметрами по умолчанию один
миллионы пар считываний могут быть сопоставлены с геномом человека примерно за 10 часов ЦП с меньшими затратами
чем 1 ГБ памяти.

· Точно измерьте вероятность ошибки совмещения каждого отдельного считывания.

· Назовите согласованные генотипы, включая гомозиготные и гетерозиготные полиморфизмы, с
Каждой базе присвоено вероятностное качество Phred.

· Найдите короткие вставки с парными конечными чтениями.

· Точно находите крупномасштабные делеции и транслокации генома с парными концевыми считываниями.

· Выявите потенциальные CNV, проверив глубину чтения.

· Оцените точность исходных базовых качеств от секвенсоров и помогите проверить
систематические ошибки.

Однако Maq может НЕ:

· Делать de новое сборка. (Maq может вызвать консенсус только путем сопоставления чтения с известным
Справка.)

· Карта шорт читает против самих себя. (Maq может найти только полное перекрытие между чтениями.)

· Совместите показания капилляра или 454 отсчета с эталоном. (Maq не может выравнивать чтения длиннее, чем
63бп.)

MAQ КОМАНДЫ


Основные Команды

fasta2bfa MAQ fasta2bfa in.ref.fasta out.ref.bfa

Преобразуйте последовательности в формате FASTA в формат Maq BFA (двоичный FASTA).

fastq2bfq MAQ fastq2bfq [-n читает] in.read.fastq out.read.bfqисходящий префикс

Преобразование операций чтения в формате FASTQ в формат Maq BFQ (двоичный FASTQ).

ОПЦИИ:

-n INT количество чтений на файл [не указано]

карта MAQ карта [-n нми] [-a максинс] [-c] [-1 len1] [-2 len2] [-d Adap3] [-m бормотать]
[-u не нанесенный на карту] [-е Максерр] [-M с⎪г] [-N] [-H все хиты] [-C макситы] out.aln.map
in.ref.bfa in.read1.bfq [in.read2.bfq] 2> out.map.log

Карта читает ссылочные последовательности.

ОПЦИИ:

-n INT Количество максимальных несовпадений, которые всегда можно найти [2]

-a INT Максимальное внешнее расстояние для правильной пары чтения [250]

-A INT Максимальное внешнее расстояние при считывании двух параллельных радиочастот (0 для отключения) [0]

-c Карта читается в цветовом пространстве (только для SOLiD)

-1 INT Длина чтения при первом чтении, 0 для авто [0]

-2 INT Длина чтения для второго чтения, 0 для авто [0]

-m FLOAT Скорость мутации между эталонными последовательностями и считыванием [0.001]

-d ФАЙЛОВ Укажите файл, содержащий одну строку последовательности 3'-адаптера
[значение NULL]

-u ФАЙЛОВ Дамп несопоставленных операций чтения и чтения, содержащих более нми несоответствия
отдельный файл [null]

-e INT Порог по сумме несовпадающих базовых качеств [70]

-H ФАЙЛОВ Сбросить несколько / все попадания с несоответствием 01 в ФАЙЛОВ [значение NULL]

-C INT Максимальное количество обращений к выводу. Неограниченно, если больше 512. [250]

-M c⎪g режим выравнивания метилирования. Все C (или G) на передней нити будут
изменился на T (или A). Этот вариант предназначен только для тестирования.

-N сохранить позицию несоответствия в выходном файле out.aln.map. Когда это
используется, максимально допустимая длина чтения - 55 бит.

ПРИМЕЧАНИЕ:

* Парные конечные чтения должны быть подготовлены в двух файлах, по одному для каждого конца, с
чтения отсортированы в том же порядке. Это означает, что k-е чтение в первом
файл сопоставляется с k-м чтением во втором файле. Соответствующее чтение
имена должны быть идентичны до конца «/ 1» или «/ 2». Например, такой
разрешены пары имен чтения: `EAS1_1_5_100_200 / 1 'и
`EAS1_1_5_100_200 / 2 '. Хвост / [12] обычно генерируется
GAPipeline, чтобы различать два конца в паре.

* На выходе получается сжатый двоичный файл. На это влияет порядок байтов.

* Лучший способ запустить эту команду - обеспечить от 1 до 3 миллионов чтений как
Вход. Чем больше операций чтения, тем больше памяти.

* Вариант -n контролирует чувствительность выравнивания. По умолчанию обращение с
Всегда можно найти до 2-х несовпадений. Выше -n находит больше хитов, а также
повышает точность отображения качества. Однако это делается за счет
скорости.

* Совмещения со многими несоответствиями высокого качества следует отбрасывать как ложные.
совмещения или возможные загрязнения. Это поведение контролируется опцией
-e, -e порог рассчитывается только приблизительно, потому что базовые качества
делятся на 10 на определенном этапе расклада. В -Q вариант в
собираться команда точно устанавливает порог.

* Пара считываний считается правильно спаренной тогда и только тогда, когда
ориентация FR а внешнее расстояние пары не превышает
максинс. Ограничений по минимальному размеру вставки нет. Этот параметр
определяется алгоритмом парного выравнивания концов, используемым в Maq. Требование
минимальный размер вставки приведет к неправильному выравниванию с
завышенные картографические качества.

* В настоящее время пары чтения из библиотеки длинных вставок Illumina / Solexa имеют RF-чтение
ориентация. Максимальный размер вставки устанавливается опцией. -A. Однако долгое время
библиотека вставки также смешана с небольшой долей чтения коротких вставок
пар. -a также должны быть установлены правильно.

* Иногда 5'-конец или даже вся последовательность 3'-адаптера может быть секвенирована.
Обеспечение -d оказывает Maq для устранения загрязнения адаптера.

* Учитывая 2 миллиона считываний в качестве входных данных, MAQ обычно занимает 800МБ памяти.

слияние карт MAQ слияние карт out.aln.map in.aln1.map in.aln2.map [...]

Объедините пакет считанных выравниваний вместе.

ПРИМЕЧАНИЕ:

* Теоретически эта команда может объединять неограниченное количество выравниваний. Однако, как
mapmerge будет читать все входные данные одновременно, он может попасть в
ограничение максимального количества открываемых файлов, установленное ОС. В настоящее время это
должны решаться вручную конечными пользователями.

* Команда слияние карт может использоваться для объединения файлов выравнивания с разным считыванием
длины. Все последующие анализы больше не предполагают фиксированной длины.

rmdup MAQ rmdup out.rmdup.map in.ori.map

Удалите пары с одинаковыми внешними координатами. В принципе, пары с
одинаковые внешние координаты должны встречаться редко. Однако из-за
амплификации при пробоподготовке, это происходит гораздо чаще, чем при
шанс. Практический анализ показывает, что удаление дубликатов помогает улучшить
общая точность вызова SNP.

собираться MAQ собираться [-сп] [-m максмис] [-Q Максерр] [-r превозносить] [-t Coef] [-q минQ] [-N
нхап] out.cns in.ref.bfa in.aln.map 2> out.cns.log

Вызов консенсусных последовательностей из чтения карт.

ОПЦИИ:

-t FLOAT Коэффициент зависимости от ошибок [0.93]

-r FLOAT Доля гетерозигот среди всех сайтов [0.001]

-s В качестве окончательного качества отображения принимайте качество отображения на одном конце;
в противном случае будет использоваться качество парного конечного сопоставления

-p Отбросить парные конечные чтения, которые не отображаются в правильных парах

-m INT Максимальное количество несовпадений, разрешенное для чтения, которое может использоваться в
призыв к согласию [7]

-Q INT Максимально допустимая сумма значений качества несовпадающих баз [60]

-q INT Минимальное качество отображения, позволяющее использовать чтение в консенсусе
звонит [0]

-N INT Количество гаплотипов в пуле (> = 2) [2]

ПРИМЕЧАНИЕ:

* Вариант -Q устанавливает предел максимальной суммы несовпадающих базовых качеств.
Чтения, содержащие много качественных несоответствий, следует отбрасывать.

* Вариант -N устанавливает количество гаплотипов в пуле. Он предназначен для
повторное упорядочение образцов путем объединения нескольких штаммов / особей вместе. Для
ресеквенирование диплоидного генома, этот вариант равен 2.

glfgen MAQ glfgen [-сп] [-m максмис] [-Q Максерр] [-r превозносить] [-t Coef] [-q минQ] [-N
нхап] out.cns in.ref.bfa in.aln.map 2> out.cns.log

Рассчитайте логарифмическую вероятность для всех генотипов и сохраните результаты в формате GLF
(Формат вероятности генотипирования). Пожалуйста, посетите веб-сайт MAQ для получения подробной информации
описание формата файла и связанных с ним утилит.

индельп MAQ индельп in.ref.bfa in.aln.map > аут.индельпе

Вызов согласованных индексов из парных конечных чтений. Выходные данные разделены табуляцией
каждая строка, состоящая из хромосомы, начальной позиции, типа отступа, номера
считываний по отступу, размер отступа и вставленных / удаленных нуклеотидов
(через двоеточие), количество отступов на обратной нити, количество отступов
на прямой нити, последовательность 5 'перед отступом, последовательность 3' после
отступ, количество прочитанных, выровненных без отступов, и три дополнительных столбца
для фильтров.

В 3-м столбце, тип отступа, звездочка означает, что отступ подтвержден.
при чтении из обеих цепей плюс означает, что по отступу выполнено как минимум два чтения
но в той же цепочке минус означает, что индекс обнаружен только при одном чтении,
а точка означает, что отступ расположен слишком близко к другому отступу и отфильтрован.

Пользователям рекомендуется запустить `maq.pl indelpe ', чтобы исправить количество
читает сопоставленные без вложений. Для получения дополнительной информации см. `Maq.pl indelpe '
.

индельсоа MAQ индельсоа in.ref.bfa in.aln.map > Out.indelsoa

Вызов потенциальных гомозиготных инделей и точек останова, обнаруживая аномальные
шаблон выравнивания вокруг отступов и точек разрыва. Вывод также TAB
разделены каждой строкой, состоящей из хромосомы, приблизительной координаты,
длина аномальной области, количество чтений, отображаемых по позиции,
количество чтений в левой части позиции и количество чтений в
правая часть. Последний столбец можно игнорировать.

Вывод содержит много ложных срабатываний. Рекомендуемый фильтр может быть:

awk '$ 5 + $ 6- $ 4> = 3 && $ 4 <= 1' дюйм. index

Обратите внимание, что эта команда не является точным детектором отступов, но
в основном помогает избежать ложных срабатываний при вызове замены. В
кроме того, он хорошо работает только при большой глубине (например, ~ 40X); в противном случае
ложноотрицательный показатель будет очень высоким.

Формат преобразование

sol2sanger MAQ sol2sanger дюйм. раствор. fastq out.sanger.fastq

Преобразование Solexa FASTQ в стандартный формат / формат Sanger FASTQ.

bfq2fastq MAQ bfq2fastq in.read.bfq out.read.fastq

Преобразуйте формат BFQ Maq в стандартный формат FASTQ.

картаpass2maq MAQ картаpass2maq in.mapass2.map out.maq.map

Преобразование устаревшего формата карты mapass2 в формат карты Maq. Старый формат делает
не содержать прочитанных имен.

Информация экстрагирование

карта MAQ карта [-bN] in.aln.map > out.aln.txt

Отображение прочитанного выравнивания в виде обычного текста. Для чтений, выровненных до Smith-
Выравнивание Уотермана, каждая строка состоит из прочитанного имени, хромосомы, положения,
прядь, размер вставки из внешних координат пары, парный флаг, отображение
качество, качество отображения на одном конце, качество альтернативного отображения, количество
несовпадение лучшего хита, сумма качеств несовпадающих баз лучших
попадание, количество совпадений с нулевым несоответствием первых 0 б.п., количество совпадений с несоответствием 24 из
первые 24bp по ссылке, длине чтения, последовательности чтения и ее
качественный. Альтернативное качество отображения всегда равно качеству отображения, если
чтения не парные. Если чтения парные, это соответствует меньшему отображению
качество двух концов. Это альтернативное качество отображения на самом деле является
качество отображения аномальной пары.

Пятый столбец, парный флаг, является побитовым флагом. Его младшие 4 бита дают
ориентация: 1 означает FF, 2 - FR, 4 - RF, 8 - RR, где FR означает
что считывание с меньшей координатой находится на прямой цепи, а его ответ -
на обратной пряди. Для правильной пары допускается только FR. Старшие биты
этого флага дают дополнительную информацию. Если пара встречает парный конец
требование, будет установлено 16. Если два чтения сопоставлены с разными
хромосомы, будет установлено 32. Если одно из двух чтений не может быть отображено вообще,
Будет установлено 64. Флаг правильной пары всегда равен 18.

Для считываний, выровненных впоследствии выравниванием Смита-Уотермана, флаг
всегда 130. Строка состоит из прочитанного имени, хромосомы, позиции, нити, вставки
размер, флаг (всегда 130), позиция отступа при чтении (0, если отступа нет),
длина вставок (положительная для вставок и отрицательная для удалений),
качество отображения сопряжения, количество несовпадений лучшего совпадения, сумма
качества несовпадающих оснований лучшего совпадения, два нуля, длина чтения,
последовательность чтения и ее качество. Сопряжение чтения с отметкой 130 всегда получает
флаг 18.

Флаг 192 указывает, что чтение не отображается, но отображается его сопряжение. Для таких
пара чтения, одно чтение имеет флаг 64, а другое - 192.

ОПЦИИ:

-b не отображать последовательность чтения и качество

-N отображать позиции, в которых возникают несовпадения. Этот флаг работает только
с файлом .map, созданным с помощью `maq map -N '.

карта MAQ карта [-s] [-m максмис] [-q минQ] in.ref.bfa in.aln.map > out.mapcheck

Прочтите проверку качества. Mapcheck сначала сообщает состав и глубину
ссылка. После этого есть форма. В первом столбце указывается
позиция по чтению. Следующие четыре столбца показывают нуклеотид
будет дан состав, коэффициенты замены между ссылкой и прочтениями.
Эти скорости и числа в следующих столбцах масштабируются до 999 и
округлено до ближайшего целого числа. Следующая группа столбцов показывает распределение
базовые качества по показаниям с интервалом качества 10. Снижение качества
обычно можно наблюдать, что означает, что базы в конце чтения меньше
точный. В последней группе столбцов представлена ​​доля замен для
читал базы с интервалом качества. Это измеряет точность базового качества.
предварительный расчет. В идеале, мы ожидаем увидеть 1 из 3? столбец, 10 в 2? столбец
и 100 в 1? столбец.

ОПЦИИ:

-s В качестве окончательного качества отображения выберите качество отображения на одном конце.

-m INT Максимальное количество несоответствий, разрешенное для подсчета чтения [4]

-q INT Минимальное качество отображения, позволяющее считать считывание [30]

наложение MAQ наложение [-спвП] [-m максмис] [-Q Максерр] [-q минQ] [-l файл сайта] in.ref.bfa
in.aln.map > out.pileup

Отобразите выравнивание в текстовом формате pileup. Каждая строка состоит из
хромосома, положение, справочная база, глубина и основания на прочтениях, что обложка
эта позиция. Если -v добавляется в командную строку, базовые качества и отображение
качества будут представлены в шестой и седьмой колонках по порядку.

Пятая колонка всегда начинается с символа «@». В этом столбце читать базы идентичные
к ссылке отображаются запятой `, 'или точкой`.', а базы чтения разные
из ссылки в письмах. Запятая или верхний регистр означает, что основание
происходит от чтения, выровненного на передней нити, в то время как точка или нижний регистр на
обратная прядь.

Эта команда предназначена для пользователей, которые хотят разработать собственных вызывающих абонентов SNP.

ОПЦИИ:

-s В качестве окончательного качества отображения выберите качество отображения на одном конце.

-p Отбросить парные конечные чтения, которые не отображаются как правильные пары

-v Вывод подробной информации, включая базовые качества и отображение
качества

-m INT Максимальное количество несовпадений, разрешенное для использования чтения [7]

-Q INT Максимально допустимое количество значений качества несовпадений [60]

-q INT Минимальное качество сопоставления, разрешенное для использования чтения [0]

-l ФАЙЛОВ Файл, содержащий сайты, на которых будет распечатываться pileup. В этом
файл первый столбец дает имена ссылки, а второй
координаты. Дополнительные столбцы игнорируются. [нулевой]

-P также вывести базовую позицию на прочитанном

cns2fq MAQ cns2fq [-Q minMapQ] [-n минNeiQ] [-d минГлубина] [-D Максимальная глубина] in.cns >
out.cns.fastq

Извлеките согласованные последовательности в формате FASTQ. В строках последовательности основания
в нижнем регистре по существу повторяются или не имеют достаточного покрытия; базы
в верхнем регистре указывают регионы, в которых можно надежно вызывать SNP. в
качества строк, ASCII символа минус 33 дает качество PHRED.

ОПЦИИ:

-Q INT Минимальное качество отображения [40]

-d INT Минимальная глубина чтения [3]

-n INT Минимальное соседнее качество [20]

-D INT Максимальное чтение dpeth. > = 255 для безлимитного. [255]

cns2snp MAQ cns2snp in.cns > аут.snp

Извлеките сайты SNP. Каждая строка состоит из хромосомы, позиции, опорной базы,
база консенсуса, качество консенсуса, подобное Phred, глубина чтения, среднее количество
совпадения чтений, охватывающих эту позицию, высочайшее качество отображения чтения
покрытие позиции, минимальное качество консенсуса при фланкировании на 3 б.п.
регионы на каждой стороне сайта (всего 6 б.п.), второй лучший звонок, лог
отношение правдоподобия второго лучшего и третьего лучшего колла и третьего лучшего
вызов.

Пятый столбец является ключевым критерием при оценке надежности SNP.
Однако, поскольку это качество рассчитывается только при условии независимости сайта, вы
следует также рассмотреть другие столбцы, чтобы получить более точные вызовы SNP. Сценарий
команда `maq.pl SNPфильтр'предназначен для этого (см. ниже).

В 7-м столбце указано, относится ли сайт к повторяющейся области. Если нет
прочитанное покрытие сайта может быть нанесено на карту с высоким качеством отображения, фланкирующие
область, возможно, повторяется или из-за отсутствия хороших чтений. SNP на таком сайте
обычно ненадежен.

В 8-м столбце примерно указано количество копий фланкирующей области в
эталонный геном. В большинстве случаев это число приближается к 1.00, что означает
регион уникален. Иногда вы можете увидеть ненулевую глубину чтения, но 0.00 при
7 столбец. Это означает, что все чтения, охватывающие позицию, имеют
минимум два несовпадения. Maq подсчитывает только количество совпадений с 0 и 1 несоответствием.
ссылка. Это связано со сложной технической проблемой.

В 9-м столбце указано соседнее качество. Фильтрация по этому столбцу также
требуется для получения надежных SNP. Эта идея вдохновлена ​​NQS, хотя NQS
изначально предназначен для однократного чтения, а не для достижения консенсуса.

cns2view MAQ cns2view in.cns > внешний вид

Показать подробную информацию на всех сайтах. Формат вывода идентичен
cns2snp сообщить.

cns2ref MAQ cns2ref in.cns > out.ref.fasta

Извлеките контрольную последовательность.

cns2win MAQ cns2win [-w выигрыш] [-c CHR] [-b начинать] [-e конец] [-q минQ] in.cns >
аут.выигрыш

Извлеките усредненную информацию в окне обработки почвы. Вывод разделен табуляцией,
который состоит из ссылочного имени, координаты, деленной на 1,000,000, скорости SNP,
скорость чтения, глубина необработанного чтения, глубина чтения примерно в уникальных регионах,
среднее количество совпадений чтения в окне и процент GC.

ОПЦИИ:

-w INT Размер окна [1000]

-c STR Назначенная эталонная последовательность; в противном случае будут использоваться все ссылки
[значение NULL]

-b INT Начальная позиция, 0 без ограничений [0]

-e INT Конечная позиция, 0 без ограничения [0]

-q INT Минимальное согласованное качество используемых сайтов [0]

моделирование Похожие страницы:

фальшивый MAQ фальшивый [-r бормотать] [-R Indelfrac] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

Произвольно вводите в ссылку замены и отступы. Замены и
могут быть добавлены отдельные индели для пары оснований.

ОПЦИИ:

-r FLOAT Скорость мутации [0.001]

-R FLOAT Доля изменяемых мутаций [0.1]

Simutrain MAQ Simutrain out.simupars.dat in.read.fastq

Оцените / обучите параметры для моделирования чтения.

имитировать MAQ имитировать [-d insize] [-s STDEV] [-N nЧитает] [-1 readLen1] [-2 readLen2] [-r
мутрейт] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq in.ref.fasta
in.simupars.dat

Имитация парных конечных чтений. Файл in.simupars.dat определяет длину чтения и
качественное распространение. Он генерируется из Simutrain, или его можно скачать с
Веб-сайт Maq. В выходных файлах чтения имя чтения состоит из ссылки
имя последовательности и внешние координаты пары смоделированных чтений. К
по умолчанию, имитировать предполагает, что чтения происходят из диплоидной последовательности, которая генерируется
добавлением двух разных наборов мутаций, включая отступы одной пары оснований, к
in.ref.fasta.

ОПЦИИ:

-d INT среднее внешнее расстояние размеров пластин [170]

-s INT стандартное отклонение размеров пластин [20]

-N INT количество пар чтений, которые должны быть сгенерированы [1000000]

-1 INT длина первого чтения [устанавливается in.simupars.dat]

-2 INT длина второго чтения [устанавливается in.simupars.dat]

-r FLOAT частота мутаций [0.001]

-R FLOAT доля инделей в 1 б.п. [0.1]

-h добавить все мутации в in.ref.fasta и генерировать чтения из сингла
мутированная последовательность (гаплоидный режим)

ПРИМЕЧАНИЕ:

* Чтения, сгенерированные этой командой, независимы, что отличается от
правда. В то время как оценка согласования менее подвержена этому влиянию, оценка на
Вызов SNP следует выполнять с осторожностью. Зависимость от ошибок может быть одной из
основные причины неправильных вызовов SNP.

симустат MAQ симустат in.simu-aln.map > out.симустат

Оцените качество отображения на основе моделирования чтения.

Твердый Похожие страницы:

fasta2csfa MAQ fasta2csfa in.nucl-ref.fasta > out.color-ref.fasta

Преобразуйте нуклеотид FASTA в FASTA с цветовой кодировкой. Флаг -c затем следует применить
в карта команда. На выходе буква «A» обозначает цвет 0, «C» - 1, «G».
для 2 и `T 'для 3. Каждая последовательность на выходе на 1bp короче, чем на входе.

csmap2nt MAQ csmap2nt out.nt.map ин.реф.нт.бфа дюймовая карта

Преобразуйте выравнивание цвета в выравнивание нуклеотидов. Вход ин.реф.нт.бфа это
бинарный нуклеотидный справочный файл FASTA. Он должен соответствовать исходному файлу
из которого преобразуется цветовая ссылка. Нуклеотидный консенсус можно назвать
от результирующего выравнивания.

Разное / Дополнительно Команды

дополнительная карта MAQ дополнительная карта [-q minMapQ] [-Q maxSumErr] [-m максмм] [-p] out.map дюйм. карта

Отфильтровать неверные выравнивания в дюйм. карта. Параметры командной строки описаны в
`собиратьсякоманда.

Эланд2мак MAQ Эланд2мак [-q по умолчанию] out.map in.list in.eland

Преобразуйте выравнивание eland в формат maq .map. Файл in.list состоит из
имена последовательностей, которые появляются в седьмом столбце файла выравнивания eland
in.eland и имя, которое вы ожидаете увидеть при выравнивании maq. Ниже приводится
пример:

cX.fa chrX
c1.fa chr1
c2.fa chr2

Если вы выравниваете чтения в нескольких пакетах с помощью eland, важно
использовать то же самое in.list для преобразования. Кроме того, maq загрузит все
выравнивания и отсортируйте их в памяти. Если вы объединили несколько канн
выходы в один огромный файл, вы должны разделить его на более мелкие файлы, чтобы
запретить maq съесть всю память вашей машины.

Эта команда на самом деле предназначена для отображения выравнивания Eland в Maqview. Как без качества
информация доступна, результирующий файл выравнивания maq не должен использоваться
называть консенсусными генотипами.

экспорт2мак MAQ экспорт2мак [-1 read1len] [-2 read2len] [-a максдист] [-n] out.map in.list
in.export

Преобразование формата экспорта Illumina в формат Maq .карта формат. Формат экспорта - новый
формат выравнивания, начиная с SolexaPipeline-0.3.0, который также вычисляет отображение
такие качества как maq. Полученный файл можно использовать для вызова согласованных генотипов.
Поскольку большая часть необходимой информации доступна для maq, чтобы сделать это точно.

ОПЦИИ:

-1 INT Длина первого чтения [0]

-2 INT Длина второго чтения [0]

-a INT Максимальное внешнее расстояние для правильной пары чтения [250]

-n Сохранить отфильтрованные чтения

МАК-ПЕРЛ КОМАНДЫ


демонстрация maq.pl демонстрация [-h] [-s] [-N nPairs] [-d outDir] ин.фаста дюйм симудат

Продемонстрируйте использование MAQ и сопутствующие сценарии. Эта команда будет
имитировать чтение из файла FASTA ин.фаста. Длина и качество последовательности
определяются дюйм симудат который генерируется из MAQ Simutrain или может быть
скачано с сайта Maq. Затем смоделированные чтения будут сопоставлены с
maq.pl легкий бег. Точность центровки оценивается MAQ симустат,
точность консенсуса MAQ симукнс, а точность SNP - на maq_eval.pl.

По умолчанию будут моделироваться парные конечные чтения, а диплоидная последовательность будет
генерируется из ввода путем добавления мутаций к любому гаплоидному типу. Вставка
размер и скорость мутаций контролируются MAQ имитировать.

ОПЦИИ:

-h имитировать гаплоидную последовательность вместо диплоидной последовательности

-s используйте односторонний режим для выравнивания чтения вместо режима парного конца

-N INT количество пар считываний для моделирования [1000000]

-d DIR выходной каталог [maqdemo]

ПРИМЕЧАНИЕ:

* Выходные файлы из maq_eval.pl не были задокументированы, но вы можете сделать
хорошее предположение о некоторых из этих файлов.

* Эта команда просто демонстрирует использование пакета maq. Точность на реальном
данные почти всегда ниже, чем то, что вы видите в чистом моделировании.

легкий бег maq.pl легкий бег [-1 read1Len] [-d out.dir] [-n nЧитает] [-A 3адаптер] [-e minDep]
[-q minCnsQ] [-p] [-2 read2Len] [-a максИнс] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]

Анализирует конвейер для небольших геномов. Команда Easyrun выполнит большинство анализов
в MAQ, По умолчанию, легкий бег предполагает все входные последовательности чтения
файлы бывают односторонними и независимыми; когда -p указано, две последовательности чтения
файлы необходимы, по одному на каждый конец.

Несколько файлов будут созданы в out.dir, среди которых следующие файлы
ключевой вывод:

cns.final.snp окончательные вызовы SNP с отфильтрованными вызовами низкого качества

cns.fq согласованные последовательности и качества в формате FASTQ

ОПЦИИ:

-d DIR выходной каталог [easyrun]

-n INT количество чтений / пар в одном пакете выравнивания [2000000]

-S применять раздельный анализ коротких вставок (возможно, очень медленно)

-N INT количество гаплотипов / штаммов в пуле (> = 2) [2]

-A ФАЙЛОВ файл для 3'-адаптера. Файл должен содержать одну строку последовательности
[значение NULL]

-1 INT длина первого чтения, 0 для авто [0]

-e INT минимальная глубина чтения, необходимая для вызова SNP (для SNPfilter) [3]

-q INT минимальное качество консенсуса для SNP в cns.final.snp [30]

-p перейти в режим выравнивания парных концов

-2 INT длина второго чтения, когда -p применяется [0]

-a INT максимальный размер вставки при -p применяется [250]

ЗАМЕТКИ:

* Для вызова SNP для объединенных выборок пользователи должны правильно установить-N' а также
`-E 0 '.

* Входной файл может быть в двоичном формате maq. maq.pl автоматически обнаружит
формат файла.

SNPфильтр maq.pl SNPфильтр [-d minDep] [-D максдеп] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n минNeiQ] [-F Индельпе] [-f in.indelsoa] [-s minScore] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinSize] in.cns2snp.snp >
out.filtered.snp

Исключите SNP, охватываемые несколькими чтениями (заданными -d) слишком многими
читает (указано -D), рядом (указано -w) до потенциальной индели, падающей
в возможной повторяющейся области (характеризуется -Q), либо имеющие некачественные
соседние базы (указаны -n). если maxWinSNP или более SNP появляются в любом
densWinSize окна, они также будут отфильтрованы вместе.

ОПЦИИ:

-d INT Минимальная глубина чтения, необходимая для вызова SNP [3]

-D INT Максимальная глубина чтения, необходимая для вызова SNP (<255, в противном случае игнорируется)
[256]

-Q INT Требуемое максимальное качество отображения считываний, покрывающих SNP [40]

-q INT Минимальное качество консенсуса [20]

-n INT Минимальное соседнее качество консенсуса [20]

-w INT Размер окна вокруг потенциальных отступов. Близкие SNP
в индели будут подавлены [3]

-F ФАЙЛОВ индельп вывод [ноль]

-f ФАЙЛОВ индельсоа вывод [ноль]

-s INT Минимальный балл для рассмотрения соа-индель [3]

-m INT Максимальное количество чтений, которое может быть отображено в soa-indel [1]

-a Альтернативный фильтр для одностороннего выравнивания

индельп maq.pl индельп Индельпе > аут.индельпе

Исправьте количество считываний, отображаемых без индексов для гомополимерных участков. Этот
команда изменяет 4-й, 10-й и последние три столбца Индельпе и
вывести результат в аут.индельпе. После исправления следующие AWK
команда дает предполагаемые гомозиготные индели:

awk '($ 3 == "*" ⎪⎪ $ 3 == "+") && $ 6 + $ 7> = 3 && (6 $ + 7 $) / 4 $> = 0.75'

и следующее дает гетерозиготы:

awk '($ 3 == "*" ⎪⎪ $ 3 == "+") && $ 6 + $ 7> = 3 && (6 $ + 7 $) / 4 $ <0.75'

Обратите внимание, что это индельп команда просто реализует несколько эвристических правил.
Он не подходит для нечистых гомополимерных серий или динуклеотидов / триплетов.
повторяется. Следовательно, две команды awk дают только приблизительное значение hom / het
индели.

ПРИМЕРЫ


· Скрипт Easyrun:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· Ключевые команды easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq часть1.fastq часть1.bfq;
maq fastq2bfq часть2.fastq часть2.bfq;
карта maq part1.map ref.bfa part1.bfq;
карта maq part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq собрать cns.cns ref.bfa aln.map;

Используйте maq онлайн с помощью сервисов onworks.net


Ad


Ad

Новейшие онлайн-программы для Linux и Windows