англійськафранцузькаіспанська

Ad


Значок OnWorks

maq - онлайн в хмарі

Запустіть maq у постачальнику безкоштовного хостингу OnWorks через Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

Це команда maq, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

ПРОГРАМА:

ІМ'Я


Maq – відображення та складання з якостями

СИНТАКСИС


мак команда [опції] аргументація

maq.pl команда [опції] аргументація

ОПИС


Maq — це програмне забезпечення, яке створює збірки відображення з коротких зчитування, згенерованих наступним-
генераційні секвенаторні машини. Він спеціально розроблений для Illumina-Solexa 1G Genetic
Analyzer і має попередню функціональність для обробки даних AB SOLiD.

За допомогою Maq ви можете:

· Швидке вирівнювання Illumina/SOLiD зчитує еталонний геном. З параметрами за замовчуванням один
мільйони пар зчитування можна зіставити з геномом людини приблизно за 10 годин процесора з меншою
ніж пам'ять 1G.

· Точно виміряти ймовірність помилки вирівнювання кожного окремого прочитаного.

· Назвіть консенсусні генотипи, включаючи гомозиготний і гетерозиготний поліморфізми, з
імовірнісна якість Phred, присвоєна кожній базі.

· Знайдіть короткі індели з парними кінцевими читаннями.

· Точно знайти великомасштабні геномні делеції та транслокації з парними кінцевими зчитуваннями.

· Відкрийте потенційні CNV, перевіривши глибину читання.

· Оцініть точність вихідних базових якостей із секвенсорів та допоможіть перевірити
систематичні помилки.

Однак Мак може НЕ:

· Робити de novo складання. (Maq може викликати консенсус лише шляхом зіставлення читань з відомим
посилання.)

· Карта шорти читає проти себе. (Maq може знайти лише повне перекриття між читаннями.)

· Вирівняйте капілярні зчитування або 454 зчитування з посиланням. (Maq не може вирівнювати читання довше ніж
63 bp.)

MAQ КОМАНДИ


ключ Команди

fasta2bfa мак fasta2bfa in.ref.fasta out.ref.bfa

Перетворіть послідовності у форматі FASTA у формат BFA (бінарний FASTA) Maq.

fastq2bfq мак fastq2bfq [-n nreads] in.read.fastq out.read.bfqпоза.префікс

Перетворіть читання у форматі FASTQ у формат BFQ (бінарний FASTQ) Maq.

ВАРІАНТИ:

-n INT кількість читань на файл [не вказано]

карта мак карта [-n nmis] [-a maxins] [-c] [-1 len1] [-2 len2] [-d адаптація3] [-m мутувати]
[-u ненаписаний] [-е maxerr] [-M c⎪g] [-N] [-H всі хіти] [-C maxhits] out.aln.map
in.ref.bfa in.read1.bfq [in.read2.bfq] 2> out.map.log

Карта зчитує опорні послідовності.

ВАРІАНТИ:

-n INT Кількість максимальних невідповідностей, які завжди можна знайти [2]

-a INT Максимальна зовнішня відстань для правильної пари зчитування [250]

-A INT Максимальна зовнішня відстань двох оплачених радіочастотних зчитування (0 для вимкнення) [0]

-c Карта читається в колірному просторі (лише для SOLiD)

-1 INT Довжина читання для першого читання, 0 для автоматичного [0]

-2 INT Довжина читання для другого читання, 0 для автоматичного [0]

-m ПЛОС Швидкість мутації між еталонними послідовностями та зчитуваннями [0.001]

-d Фото Вкажіть файл, що містить один рядок послідовності 3'-адаптера
[нуль]

-u Фото Дамп невідображених читань і читань, що містять більше ніж nmis невідповідності до
окремий файл [null]

-e INT Порогове значення суми невідповідних базових якостей [70]

-H Фото Скидати кілька/всі збіги з невідповідністю 01 Фото [нуль]

-C INT Максимальна кількість звернень для виведення. Необмежено, якщо більше 512. [250]

-M c⎪g режим вирівнювання метилювання. Усі C (або G) на передньому пасмі будуть
змінено на T (або A). Цей параметр призначений лише для тестування.

-N зберігати позицію невідповідності у вихідному файлі out.aln.map. Коли це
використовується опція, максимальна дозволена довжина читання становить 55 bp.

ПРИМІТКА:

* Парні кінцеві читання повинні бути підготовлені у двох файлах, по одному для кожного кінця, с
читання сортуються в тому ж порядку. Це означає k-е читання в першому
файл поєднується з k-м прочитаним у другому файлі. Відповідне читання
імена повинні бути ідентичними аж до хвоста `/1' або `/2'. Наприклад, такий
допустима пара прочитаних імен: `EAS1_1_5_100_200/1' та
`EAS1_1_5_100_200/2'. Хвост `/[12]' зазвичай генерується за допомогою
GAPipeline для розрізнення двох кінців у парі.

* Результатом є стиснутий двійковий файл. На нього впливає байтове значення.

* Найкращий спосіб запустити цю команду – забезпечити від 1 до 3 мільйонів читань як
введення. Більше читання споживає більше пам’яті.

* Варіант -n контролює чутливість вирівнювання. За замовчуванням хіт з
завжди можна знайти до 2 невідповідностей. Вищий -n знаходить більше хітів, а також
покращує точність відображення якостей. Однак це робиться за рахунок витрат
швидкості.

* Вирівнювання з великою кількістю високоякісних невідповідностей слід відхилити як помилкові
вирівнювання або можливі забруднення. Ця поведінка контролюється опцією
-e, -e поріг розраховується лише приблизно, оскільки базові якості
діляться на 10 на певному етапі вирівнювання. The -Q опція в
збиратися команда точно встановити поріг.

* Кажуть, що пара читань правильно об’єднана тоді і тільки тоді, коли
орієнтація є FR і зовнішня відстань пари не більше ніж
maxins. Мінімальний розмір вкладки не обмежений. Це налаштування
визначається за допомогою парного алгоритму вирівнювання кінців, що використовується в Maq. Вимагаючи а
мінімальний розмір вставки призведе до неправильного вирівнювання з високою
завищені якості картографування.

* Наразі пари зчитування з бібліотеки довгої вставки Illumina/Solexa мають радіочастотне зчитування
орієнтація. Максимальний розмір вставки встановлюється опцією -A. Однак довго-
бібліотека вставок також змішана з невеликою часткою читання короткої вставки
пар. -a також слід правильно налаштувати.

* Іноді 5'-кінець або навіть вся послідовність 3'-адаптера може бути упорядкована.
Забезпечення -d надає Maq для усунення забруднень адаптера.

* Враховуючи 2 мільйони прочитань як вхідні дані, мак зазвичай займає 800 МБ пам'яті.

mapmerge мак mapmerge out.aln.map in.aln1.map in.aln2.map [...]

Об’єднайте групу прочитаних вирівнювань разом.

ПРИМІТКА:

* Теоретично ця команда може об'єднати необмежену кількість вирівнювань. Однак, як
mapmerge буде читати всі вхідні дані одночасно, він може вразити
обмеження максимальної кількості відкриваються файлів, встановлених ОС. На даний момент це
кінцеві користувачі мають вирішувати вручну.

* Команда mapmerge можна використовувати для об’єднання файлів вирівнювання з різними читаннями
довжини. Усі наступні аналізи більше не передбачають фіксованої довжини.

rmdup мак rmdup out.rmdup.map in.ori.map

Видалити пари з ідентичними зовнішніми координатами. В принципі, в парі з
ідентичні зовнішні координати трапляються рідко. Однак через
ампліфікації при підготовці проб, це відбувається набагато частіше, ніж при
шанс. Практичний аналіз показує, що видалення дублікатів допомагає покращити
загальна точність виклику SNP.

збиратися мак збиратися [-сп] [-m maxmis] [-Q maxerr] [-r гетрувати] [-t коеф] [-q minQ] [-N
nHap] out.cns in.ref.bfa in.aln.map 2> out.cns.log

Викликати консенсусні послідовності з прочитаного відображення.

ВАРІАНТИ:

-t ПЛОС Коефіцієнт залежності від помилок [0.93]

-r ПЛОС Частка гетерозигот серед усіх ділянок [0.001]

-s Візьміть якість одностороннього відображення як кінцеву якість відображення;
в іншому випадку буде використана якість відображення парних кінців

-p Відкиньте парні кінцеві зчитування, які не відображаються у правильні пари

-m INT Максимальна кількість невідповідностей, у яких можна використовувати читання
консенсусний заклик [7]

-Q INT Максимально дозволена сума значень якості невідповідних основ [60]

-q INT Мінімальна якість відображення дозволяла використовувати читання консенсусом
дзвонить [0]

-N INT Кількість гаплотипів у пулі (>=2) [2]

ПРИМІТКА:

* Варіант -Q встановлює обмеження на максимальну суму невідповідних базових якостей.
Зчитування, що містять багато високоякісних невідповідностей, слід відкинути.

* Варіант -N встановлює кількість гаплотипів у пулі. Він призначений для
повторне секвенування зразків шляхом об’єднання кількох штамів/особин разом. Для
повторне секвенування диплоїдного геному, цей параметр дорівнює 2.

glfgen мак glfgen [-сп] [-m maxmis] [-Q maxerr] [-r гетрувати] [-t коеф] [-q minQ] [-N
nHap] out.cns in.ref.bfa in.aln.map 2> out.cns.log

Розрахувати логарифмічність ймовірності для всіх генотипів і зберегти результати у форматі GLF
(Формат імовірності генотипування). Будь ласка, перегляньте веб-сайт MAQ для детальної інформації
описи формату файлу та відповідних утиліт.

indelpe мак indelpe in.ref.bfa in.aln.map > out.indelpe

Викликати послідовні інделі з парних кінцевих читань. Вихід розділений TAB
кожна лінія складається з хромосоми, початкової позиції, типу інделя, номера
зчитування через indel, розмір indel та вставлені/видалені нуклеотиди
(розділені двокрапкою), кількість інделів на зворотному пасмі, кількість індел
на передньому нитку, послідовність 5' попереду інделя, 3' послідовність наступна
indel, кількість читань, вирівняних без indels, і три додаткові стовпці
для фільтрів.

У третьому стовпці типу indel зірочка вказує, що індель підтверджено
за зчитуванням з обох ланцюгів плюс означає, що індель зазнає принаймні двох читань
але з того самого рядка мінус показує, що indel зустрічається лише в одному зчитуванні,
а крапка означає, що індель знаходиться занадто близько до іншого інделя і відфільтровується.

Користувачам рекомендується запустити `maq.pl indelpe', щоб виправити кількість
читає відображено без інделів. Для отримання додаткової інформації див. `maq.pl indelpe'
.

indelsoa мак indelsoa in.ref.bfa in.aln.map > out.indelsoa

Викликайте потенційні гомозиготні інделі та точки розриву, виявляючи аномальні
візерунок вирівнювання навколо інделей і точок розриву. Вихід також TAB
розмежований кожною лінією, що складається з хромосоми, приблизної координати,
довжина аномальної області, кількість читань, відображених у позиції,
кількість читань у лівій частині позиції та кількість читань
права сторона. Останній стовпець можна проігнорувати.

Вихід містить багато помилкових спрацьовувань. Рекомендований фільтр може бути:

awk '$5+$6-$4 >= 3 && $4 <= 1' in.indelsoa

Зауважте, що ця команда не має на меті бути точним детектором інделя, але
в основному допомагає уникнути деяких помилкових спрацьовувань при виклику підстановки. в
крім того, він добре працює лише з урахуванням глибокої глибини (наприклад, ~40X); інакше
кількість помилкових негативних результатів буде дуже високою.

сформований Перетворення

sol2sanger мак sol2sanger in.sol.fastq out.sanger.fastq

Перетворіть Solexa FASTQ у стандартний/Sanger FASTQ формат.

bfq2fastq мак bfq2fastq in.read.bfq out.read.fastq

Перетворіть формат BFQ Maq у стандартний формат FASTQ.

mapass2maq мак mapass2maq in.mapass2.map out.maq.map

Перетворіть застарілий формат карти mapass2 у формат карти Maq. Старий формат робить
не містить прочитаних імен.

Інформація Вилучення

перегляд карти мак перегляд карти [-bN] in.aln.map > out.aln.txt

Відобразити прочитане вирівнювання у вигляді звичайного тексту. Для читань, вирівняних перед Smith-
Вирівнювання Waterman, кожен рядок складається з прочитаного імені, хромосоми, положення,
пасмо, розмір вставки із зовнішніх коорніатів пари, парний прапор, відображення
якість, якість одностороннього відображення, альтернативна якість відображення, кількість
невідповідності кращого попадання, сума якостей невідповідних основ кращого
звернення, кількість звернень з невідповідністю 0 перших 24 bp, кількість звернень з невідповідністю 1
перші 24 bp на посиланні, довжина послідовності читання, зчитування та її
якість. Альтернативна якість відображення завжди дорівнює якості відображення, якщо
читання не об’єднані в пару. Якщо читання об’єднані в пари, це дорівнює меншому відображенню
якість двох кінців. Ця альтернативна якість відображення насправді є
якість відображення аномальної пари.

П’ятий стовпець, парний прапор, є побітовим прапором. Його нижчі 4 біти дають
орієнтація: 1 означає FF, 2 для FR, 4 для RF і 8 для RR, де FR означає
що зчитування з меншою координатою знаходиться на передній нитці, а її споріднена
на зворотному пасмі. Для правильної пари дозволяється лише FR. Вищі біти
цього прапора надати додаткову інформацію. Якщо пара зустрічає парний кінець
вимога, буде встановлено 16. Якщо два читання зіставлені на різні
хромосом, буде встановлено 32. Якщо одне з двох читань взагалі неможливо зіставити,
64 буде встановлено. Прапор для правильної пари завжди дорівнює 18.

Для читань, вирівняних після вирівнювання Сміта-Уотермана, прапорець є
завжди 130. Рядок складається з прочитаного імені, хромосоми, положення, ланцюга, вставки
розмір, прапор (завжди 130), положення indel на зчитуванні (0, якщо немає indel),
довжина indels (позитивна для вставок і негативна для делецій),
якість відображення свого партнера, кількість невідповідностей найкращого влучення, сума
якості невідповідних основ найкращого попадання, два нулі, тривалість зчитування,
послідовність читання та її якість. Партнер для читання з позначкою 130 завжди отримує a
прапор 18.

Прапор 192 вказує, що зчитування не відображено, але його сполучення відображено. Для таких
пара читання, одне читання має прапор 64, а інше — 192.

ВАРІАНТИ:

-b не відображати послідовність читання та якість

-N відобразити позиції, де виникають невідповідності. Цей прапор працює лише
з файлом .map, створеним за допомогою `maq map -N'.

перевірка карти мак перевірка карти [-s] [-m maxmis] [-q minQ] in.ref.bfa in.aln.map > out.mapcheck

Прочитайте перевірку якості. Перевірка карти спочатку повідомляє про склад і глибину
посилання. Після цього йде форма. Перший стовпець вказує на
положення при читанні. Наступні чотири стовпці, які показують нуклеотид
буде надано склад, коефіцієнти заміни між посиланням і зчитуванням.
Ці ставки та числа в наступних стовпцях масштабуються до 999 і
округлено до найближчого цілого числа. Наступна група стовпців показує розподіл
базові якості вздовж зчитування з інтервалом якості 10. Зниження якості
зазвичай можна спостерігати, що означає, що підстав наприкінці читання менше
точний. Остання група стовпців містить частку замін
читати бази з інтервалом якості. Це вимірює точність якості основи
оцінка. В ідеалі ми очікуємо побачити 1 із 3? стовпець, 10 у 2? колонка
і 100 в 1? колонка.

ВАРІАНТИ:

-s Візьміть якість одностороннього відображення як кінцеву якість відображення

-m INT Максимальна кількість помилок, дозволених для підрахунку зчитування [4]

-q INT Мінімальна якість відображення дозволила підрахувати прочитане [30]

накопичувати мак накопичувати [-spvP] [-m maxmis] [-Q maxerr] [-q minQ] [-l файл сайту] in.ref.bfa
in.aln.map > out.pileup

Відобразити вирівнювання у текстовому форматі `pileup'. Кожен рядок складається з
хромосома, положення, референтна база, глибина та підстави на зчитуваннях цієї обкладинки
цю позицію. Якщо -v додається в командний рядок, базові якості та відображення
якості будуть представлені в шостій і сьомій колонках по порядку.

П'ятий стовпець завжди починається з "@". У цій колонці читайте основи ідентичні
до посилання відображаються комою `,' або крапкою `.', а основи читаються різними
з довідки в листах. Кома або верхній регістр вказує на те, що основа
походить від читання, вирівняного на передньому пасмі, тоді як крапка чи нижній регістр на ній
зворотне пасмо.

Ця команда призначена для користувачів, які хочуть розробити власні виклики SNP.

ВАРІАНТИ:

-s Візьміть якість одностороннього відображення як кінцеву якість відображення

-p Відкиньте парні кінцеві зчитування, які не відображаються як правильні пари

-v Вивести детальну інформацію, включаючи базові якості та відображення
якості

-m INT Максимальна кількість невідповідностей, дозволених для читання [7]

-Q INT Максимально дозволена кількість значень якості невідповідностей [60]

-q INT Мінімальна якість відображення, дозволена для читання [0]

-l Фото Файл, що містить сайти, на яких буде роздруковано нагромадження. У цьому
файлу перший стовпець дає назви посилання, а другий
координати. Додаткові стовпці ігноруватимуться. [нуль]

-P також вивести базову позицію для зчитування

cns2fq мак cns2fq [-Q minMapQ] [-n minNeiQ] [-d minDepth] [-D maxDepth] in.cns >
out.cns.fastq

Витягніть консенсусні послідовності у форматі FASTQ. У рядках послідовності основи
у нижньому регістрі по суті повторюються або не мають достатнього покриття; бази
у верхньому регістрі вкажіть регіони, де можна надійно викликати SNP. В
рядків якості, ASCII символу мінус 33 дає якість PHRED.

ВАРІАНТИ:

-Q INT Мінімальна якість відображення [40]

-d INT Мінімальна глибина читання [3]

-n INT Мінімальна сусідня якість [20]

-D INT Максимальний dpeth читання. >=255 без обмежень. [255]

cns2snp мак cns2snp in.cns > out.snp

Витягувати сайти SNP. Кожна лінія складається з хромосоми, положення, опорної бази,
консенсусна база, Phred-подібна якість консенсусу, глибина читання, середня кількість
хіти читань, що охоплюють цю позицію, найвища якість відображення читань
покриття позиції, мінімальна якість консенсусу у флангу 3 б.п
регіонів на кожній стороні сайту (всього 6 б.п.), другий найкращий виклик, журнал
коефіцієнт ймовірності другого найкращого та третього найкращого виклику та третього найкращого
дзвінок.

5-й стовпець є ключовим критерієм, коли ви судите про надійність SNP.
Однак, оскільки ця якість розраховується лише за умови незалежності сайту, ви
також слід розглянути інші стовпці, щоб отримати більш точні виклики SNP. Сценарій
команда `maq.pl SNP-фільтр' призначений для цього (див. нижче).

У 7-му стовпці вказується, чи відноситься сайт до повторюваної області. Якщо ні
читання, що охоплює сайт, можна нанести на карту з високою якістю картографування, флангування
регіон, можливо, повторюваний або не має хороших читань. SNP на такому сайті
зазвичай не є надійним.

У 8-му стовпці приблизно вказано номер копії фланкуючої області в
референтний геном. У більшості випадків це число наближається до 1.00, що означає
регіон приблизно унікальний. Іноді ви можете побачити ненульову глибину зчитування, але 0.00 at
7-а колона. Це вказує на те, що всі читання, що охоплюють позицію, мають на
принаймні дві невідповідності. Maq підраховує лише кількість звернень з невідповідністю 0 та 1
посилання. Це пов'язано зі складною технічною проблемою.

9-й стовпець дає сусідню якість. Фільтрація за цим стовпцем також є
необхідні для отримання надійних SNP. Ця ідея навіяна NQS, хоча NQS так
спочатку розроблено для одного читання замість консенсусу.

cns2view мак cns2view in.cns > out.view

Показуйте детальну інформацію на всіх сайтах. Формат виведення ідентичний
cns2snp повідомити.

cns2ref мак cns2ref in.cns > out.ref.fasta

Витягніть еталонну послідовність.

cns2win мак cns2win [-w winsize] [-c хр] [-b починати] [-e кінець] [-q minQ] in.cns >
out.win

Витягти інформацію, усереднену у вікні обробки. Вихід розділений TAB,
який складається з довідкової назви, координати, поділеної на 1,000,000 XNUMX XNUMX, швидкості SNP,
швидкість, глибина необробленого читання, глибина зчитування приблизно в унікальних регіонах,
середня кількість звернень читань у вікно і відсоток GC.

ВАРІАНТИ:

-w INT Розмір вікна [1000]

-c STR Призначена еталонна послідовність; інакше будуть використані всі посилання
[нуль]

-b INT Початкова позиція, 0 без обмежень [0]

-e INT Кінцеве положення, 0 без обмежень [0]

-q INT Мінімальна консенсусна якість сайтів, які будуть використовуватися [0]

Моделювання споріднений

фейкмут мак фейкмут [-r мутувати] [-R indelfrac] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

Довільно вводьте підстановки та індекси до посилання. Заміни і
можуть бути додані одиничні базові пари.

ВАРІАНТИ:

-r ПЛОС Частота мутацій [0.001]

-R ПЛОС Частка мутацій, які мають бути інделями [0.1]

simutrain мак simutrain out.simupars.dat in.read.fastq

Оцінити/потренувати параметри для моделювання зчитування.

імітувати мак імітувати [-d insize] [-s stdev] [-N nReads] [-1 readLen1] [-2 readLen2] [-r
mutRate] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq in.ref.fasta
in.simupars.dat

Імітувати парні кінцеві зчитування. Файл in.simupars.dat визначає довжини читання і
якісний розподіл. Він генерується з simutrain, або можна завантажити з
Веб-сайт Maq. У вихідних прочитаних файлах ім’я для читання складається з посилання
ім'я послідовності та зовнішні координати пари змодельованих читань. За
за замовчуванням, імітувати припускає, що зчитування надходять із диплоїдної послідовності, яка генерується
шляхом додавання двох різних наборів мутацій, включаючи одну пару основ, до
in.ref.fasta.

ВАРІАНТИ:

-d INT середнє зовнішньої відстані розмірів вставок [170]

-s INT стандартне відхилення розмірів вставок [20]

-N INT кількість пар читань, які потрібно створити [1000000]

-1 INT тривалість першого прочитання [встанов in.simupars.dat]

-2 INT тривалість другого читання [встанов in.simupars.dat]

-r ПЛОС швидкість мутації [0.001]

-R ПЛОС частка 1 б.п. інделів [0.1]

-h додати всі мутації до in.ref.fasta і генерувати зчитування з сингла
мутована послідовність (гаплоїдний режим)

ПРИМІТКА:

* Читання, згенеровані за допомогою цієї команди, є незалежними, що відхиляється від
правда. У той час як на оцінку вирівнювання це впливає менше, оцінка ввімкнена
Виклик SNP слід виконувати з обережністю. Залежність від помилок може бути однією з таких
основні причини неправильних викликів SNP.

симустат мак симустат in.simu-aln.map > out.simustat

Оцініть якості відображення на основі змодельованих читань.

ТВЕРДИЙ споріднений

fasta2csfa мак fasta2csfa in.nucl-ref.fasta > out.colour-ref.fasta

Перетворіть нуклеотид FASTA в кольоровий FASTA. Прапор -c потім слід застосувати
до карта команда. У виводі буква "A" означає колір 0, "C" - 1, "G"
для 2 і `T' для 3. Кожна послідовність на виході на 1 bp коротша за вхідну.

csmap2nt мак csmap2nt out.nt.map in.ref.nt.bfa in.cs.map

Перетворення колірного вирівнювання на вирівнювання нуклеотидів. Вхідні дані in.ref.nt.bfa є
нуклеотидний двійковий довідковий файл FASTA. Він повинен відповідати оригінальному файлу
з якого перетворюється посилання на колір. Нуклеотидним консенсусом можна назвати
від отриманого вирівнювання.

Різне/Розширений Команди

підкарту мак підкарту [-q minMapQ] [-Q maxSumErr] [-m maxMM] [-p] out.map in.map

Відфільтруйте неправильні вирівнювання in.map. Параметри командного рядка описані в
`збиратися' команда.

eland2maq мак eland2maq [-q defqual] out.map in.list в.еландії

Перетворіть вирівнювання eland у формат .map maq. Файл in.list складається з
назви послідовностей, які відображаються в сьомому стовпці файлу вирівнювання eland
в.еландії і ім'я, яке ви очікуєте побачити у вирівнюванні maq. Далі є an
приклад:

cX.fa chrX
c1.fa Chr1
c2.fa Chr2

Якщо ви вирівнюєте зчитування кількома партіями за допомогою eland, це важливо
використовувати те саме in.list для перетворення. Крім того, maq завантажить усі файли
вирівнювання та сортування їх у пам’яті. Якщо у вас є конкатенація кількох eland
виводить в один великий файл, вам слід розділити його на менші файли
заборонити maq з'їсти всю пам'ять вашої машини.

Ця команда насправді має на меті показати вирівнювання Eland у Maqview. Як ніякої якості
якщо інформація доступна, отриманий файл вирівнювання maq використовувати не слід
називати консенсусними генотипами.

export2maq мак export2maq [-1 read1len] [-2 read2len] [-a maxdist] [-n] out.map in.list
в.експорт

Перетворіть формат експорту Illumina на формат Maq .map формат. Формат експорту новий
формат вирівнювання, починаючи з SolexaPipeline-0.3.0, який також обчислює відображення
такі якості, як maq. Отриманий файл можна використовувати для виклику консенсусних генотипів
оскільки більшість необхідної інформації доступна для maq, щоб зробити це точно.

ВАРІАНТИ:

-1 INT Тривалість першого читання [0]

-2 INT Тривалість другого читання [0]

-a INT Максимальна зовнішня відстань для правильної пари зчитування [250]

-n Зберігайте відфільтровані зчитування

MAQ-PERL КОМАНДИ


демонстрація maq.pl демонстрація [-h] [-s] [-N nПари] [-d outDir] в.фаста в.симудат

Продемонструвати використання мак і супровідні сценарії. Ця команда буде
імітувати читання з файлу FASTA в.фаста. Довжина та якості послідовності
визначаються в.симудат який генерується з мак simutrain або може бути
завантажено з веб-сайту Maq. Змодельовані читання потім будуть зіставлені з
maq.pl easyrun. Точність вирівнювання оцінюється за допомогою мак симустат,
консенсусна точність за мак simucns, і точність SNP на maq_eval.pl.

За замовчуванням будуть імітовані парні кінцеві зчитування і буде диплоїдна послідовність
генерується з вхідних даних шляхом додавання мутацій до будь-якого гаплоїдного типу. Вставка
розмір і швидкість мутації контролюються мак імітувати.

ВАРІАНТИ:

-h імітувати гаплоїдну послідовність замість диплоїдної

-s використовувати односторонній режим для вирівнювання читання замість режиму парного кінця

-N INT кількість пар читань для моделювання [1000000]

-d DIR вихідний каталог [maqdemo]

ПРИМІТКА:

* Вихідні файли з maq_eval.pl не задокументовано, але ви можете зробити
гарне припущення щодо деяких із цих файлів.

* Ця команда лише демонструє використання пакету maq. Точність по справжньому
дані майже завжди нижчі, ніж те, що ви бачите під час чистої симуляції.

easyrun maq.pl easyrun [-1 читати1Лен] [-d out.dir] [-n nReads] [-A 3адаптер] [-e minDep]
[-q minCnsQ] [-p] [-2 читати2Лен] [-a maxIns] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]

Аналізує конвеєр для невеликих геномів. Команда Easyrun запускає більшість аналізів
реалізовано в мак. За замовчуванням, easyrun передбачає всі вхідні послідовності читання
файли односторонні та незалежні; коли -p вказано, дві послідовності читання
потрібні файли, по одному для кожного кінця.

Буде створено кілька файлів out.dir, серед яких є такі файли
вихідний ключ:

cns.final.snp остаточні виклики SNP з низькоякісними відфільтрованими

cns.fq консенсусні послідовності та якості у форматі FASTQ

ВАРІАНТИ:

-d DIR вихідний каталог [easyrun]

-n INT кількість читань/пар в одній партії вирівнювання [2000000]

-S застосувати аналіз з розділеним читанням коротких індексів (можливо, дуже повільно)

-N INT кількість гаплотипів/штамів у пулі (>=2) [2]

-A Фото файл для 3'-перехідника. Файл повинен містити один рядок послідовності
[нуль]

-1 INT тривалість першого читання, 0 для автоматичного [0]

-e INT мінімальна глибина читання, необхідна для виклику SNP (для SNPfilter) [3]

-q INT мінімальна консенсусна якість для SNPs в cns.final.snp [30]

-p перейти до режиму парного вирівнювання кінців

-2 INT тривалість другого читання коли -p застосовується [0]

-a INT максимальний розмір вставки коли -p застосовується [250]

ПРИМІТКИ:

* Для виклику SNP на об’єднаних вибірках користувачі повинні встановити правильний `-N' так само, як
`-E 0 '.

* Вхідний файл може мати двійковий формат maq. maq.pl автоматично виявить
формат файлу.

SNP-фільтр maq.pl SNP-фільтр [-d minDep] [-D maxDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F in.indelpe] [-f in.indelsoa] [-s minScore] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinSize] in.cns2snp.snp >
out.filtered.snp

Виключіть SNP, які охоплюються кількома читаннями (вказані в -d), занадто багатьма
читає (визначається за -D), поблизу (вказується за -w) до потенційного indel, падіння
у можливій повторюваній області (характеризується -Q), або мають низьку якість
сусідні бази (вказані за -n). Якщо maxWinSNP або більше SNPs з'являються в будь-якому
densWinSize вікно, вони також будуть відфільтровані разом.

ВАРІАНТИ:

-d INT Мінімальна глибина читання, необхідна для виклику SNP [3]

-D INT Максимальна глибина читання, необхідна для виклику SNP (<255, інакше ігнорується)
[256]

-Q INT Необхідна максимальна якість відображення зчитування, що охоплює SNP [40]

-q INT Мінімальна консенсусна якість [20]

-n INT Мінімальна суміжна консенсусна якість [20]

-w INT Розмір вікна навколо потенційних індель. SNP, які є близькими
до indels буде придушено [3]

-F Фото Команда indelpe вивести [нуль]

-f Фото Команда indelsoa вивести [нуль]

-s INT Мінімальний бал для soa-indel, який слід враховувати [3]

-m INT Максимальна кількість читань, які можна відобразити в soa-indel [1]

-a Альтернативний фільтр для одностороннього вирівнювання

indelpe maq.pl indelpe in.indelpe > out.indelpe

Виправте кількість читань, відображених без індексів для гомополімерних трактів. Це
команда змінює 4-й, 10-й і останні три стовпці in.indelpe та
вивести результат out.indelpe. Після виправлення наступне awk
команда дає ймовірні гомозиготні індели:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

і наступне дає гетерозиготи:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

Зверніть увагу, що це indelpe команда просто реалізує кілька евристичних правил.
Це не коригує нечисті гомополімерні ряди або дінуклеотиди/триплети
повторюється. Отже, дві команди awk дають лише приблизний hom/het
індели.

ПРИКЛАДИ


· Сценарій Easyrun:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· Ключові команди, що стоять за easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq part1.fastq part1.bfq;
maq fastq2bfq part2.fastq part2.bfq;
maq map part1.map ref.bfa part1.bfq;
maq map part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq збірка cns.cns ref.bfa aln.map;

Використовуйте maq онлайн за допомогою служб onworks.net


Безкоштовні сервери та робочі станції

Завантажте програми для Windows і Linux

  • 1
    Phaser
    Phaser
    Phaser — це швидке, безкоштовне та веселе відкриття
    вихідний ігровий фреймворк HTML5, який пропонує
    Взаємовідображення WebGL і Canvas
    настільні та мобільні веб-браузери. Ігри
    можна спільно...
    Завантажити Phaser
  • 2
    Двигун ВАССАЛ
    Двигун ВАССАЛ
    VASSAL — ігровий движок для створення
    електронні версії традиційної дошки
    і карткові ігри. Він забезпечує підтримку для
    рендеринг і взаємодія ігрових елементів,
    і ...
    Завантажити VASSAL Engine
  • 3
    OpenPDF - форк iText
    OpenPDF - форк iText
    OpenPDF - це бібліотека Java для створення
    і редагування файлів PDF за допомогою LGPL і
    Ліцензія з відкритим кодом MPL. OpenPDF - це
    LGPL/MPL з відкритим кодом наступник iText,
    має ...
    Завантажте OpenPDF - Fork of iText
  • 4
    SAGA GIS
    SAGA GIS
    SAGA - Система для автоматизації
    Географічні аналізи - це географічні
    Програмне забезпечення інформаційної системи (ГІС) с
    величезні можливості для геоданих
    обробка та ана...
    Завантажити SAGA GIS
  • 5
    Панель інструментів для Java/JTOpen
    Панель інструментів для Java/JTOpen
    IBM Toolbox для Java / JTOpen є a
    бібліотека класів Java, що підтримують
    програмування клієнт/сервер та Інтернет
    моделі до системи під керуванням OS/400,
    i5/OS, o...
    Завантажте Toolbox для Java/JTOpen
  • 6
    D3.js
    D3.js
    D3.js (або D3 для документів, керованих даними)
    це бібліотека JavaScript, яка дозволяє вам
    створювати динамічні інтерактивні дані
    візуалізації у веб-браузерах. З D3
    ти ...
    Завантажити D3.js
  • Детальніше »

Команди Linux

  • 1
    abidiff
    abidiff
    abidiff - порівняння ABI файлів ELF
    abidiff порівнює двійковий файл програми
    Інтерфейси (ABI) двох спільних бібліотек
    у форматі ELF. Воно випромінює змістовне
    звіт...
    Запустіть abidiff
  • 2
    abidw
    abidw
    abidw - серіалізує ABI ELF
    файл abidw читає спільну бібліотеку в ELF
    форматує та створює представлення XML
    свого ABI до стандартного виводу. The
    випущений ...
    Запустіть abidw
  • 3
    copac2xml
    copac2xml
    bibutils - перетворення бібліографії
    комунальні послуги ...
    Запустіть copac2xml
  • 4
    копт
    копт
    copt - оптимізатор вічка SYSNOPIS:
    файл copt.. ОПИС: copt - це a
    оптимізатор вічко загального призначення. Це
    читає код зі свого стандартного вводу та
    пише...
    Біг копт
  • 5
    gather_stx_titles
    gather_stx_titles
    gather_stx_titles - заголовок збірки
    декларації з документів Stx ...
    Запустіть gather_stx_titles
  • 6
    гатлінг-бенч
    гатлінг-бенч
    bench - http benchmark ...
    Лава для бігу Гатлінга
  • Детальніше »

Ad