Amazon Best VPN GoSearch

Значок OnWorks

blasr - Интернет в облаке

Запустите blasr в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда blasr, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


blasr - сопоставляет последовательности SMRT с эталонным геномом.

СИНТАКСИС


хулиган читает.бам геном.фаста -бам -вне аут.бам

хулиган читает.фаста геном.фаста

хулиган читает.фаста геном.фаста -са геном.fasta.sa

хулиган читает.bax.h5 геном.фаста [-са геном.fasta.sa]

хулиган читает.bax.h5 геном.фаста -са геном.fasta.sa -maxScore -100 -minMatch 15 ...

хулиган читает.bax.h5 геном.фаста -са геном.fasta.sa -nproc 24 -вне выравнивание.выход ...

ОПИСАНИЕ


хулиган это программа отображения чтения, которая сопоставляет чтения с позициями в геноме путем кластеризации
короткие точные совпадения между прочитанным и геномом и подсчет кластеров с использованием выравнивания.
Соответствия генерируются путем поиска всех суффиксов чтения по геному с использованием
суффиксный массив. Методы глобальной цепочки используются для оценки кластеров совпадений.

Единственные необходимые входные данные для blasr - это файл чтения и эталонный геном. это
чрезвычайно полезно читать информацию о фильтрации, а время выполнения сопоставления может уменьшиться
по существу, когда предварительно вычисленный индекс массива суффиксов в опорной последовательности равен
указано.

Хотя операции чтения могут вводиться в формате FASTA, рекомендуется вводить файлы PacBio BAM.
потому что они содержат информацию о качественных ценностях, которая используется при выравнивании и производит
более качественное обнаружение вариантов. Хотя выравнивания можно выводить в различных форматах,
Рекомендуемый выходной формат - PacBio BAM. Поддержка файлов bax.h5 и plx.h5 будет
DEPRECATED. Поддержка таблиц регионов для файлов h5 будет DEPRECATED.

Если индекс массива суффиксов генома не указан, массив суффиксов строится до
производя выравнивание. Это может быть недопустимо медленным, когда геном большой (например, у человека).
Лучше всего предварительно вычислить массив суффиксов генома с помощью программы пилорама(1), и
затем укажите массив суффиксов в командной строке, используя -са геном.фа.са.

Необязательные параметры условно разделены на три категории: контроль привязки,
оценка выравнивания и вывод.

Параметры привязки по умолчанию оптимальны для небольших геномов и образцов с содержанием до 5%.
отклонение от эталонного генома. Главный параметр, определяющий скорость и чувствительность
это -minMatch параметр. Для выравнивания генома человека значение 11 или выше является
рекомендуемые. Для ускорения выравнивания можно использовать несколько методов за счет
возможно снижение чувствительности.

Слишком повторяющиеся области можно игнорировать во время сопоставления, ограничив количество
позиционирует прочитанные карты с -maxAnchorsPerPosition вариант. Значения от 500 до
1000 эффективны в геноме человека.

Для небольших геномов, таких как бактериальные геномы или BAC, достаточно параметров по умолчанию.
для максимальной чувствительности и хорошей скорости.

ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ


вход Файлы

Читает

читает.бам
Файл BAM PacBio для чтения. Это предпочтительный ввод для хулиган
потому что высокое качество (вставка, удаление и замена
значения качества) информация сохраняется. Дополнительное качество
информация улучшает скорость обнаружения и отображения вариантов.

читает.фаста
Мульти-фаст-файл чтений, хотя любой фаст-файл является допустимым входом

читает.bax.h5|читает.plx.h5
старые DEPRECATED формат вывода SMRT читает.

input.fofn
Файл имен файлов

-са суффиксArrayFile
Используйте массив суффиксов 'sa' для обнаружения совпадений между чтениями и
ссылка. Массив суффиксов был подготовлен пилорама(1) программа.

-ктаб таб
Таблица количества кортежей, используемая для оценки значимости совпадений. Это по
программа printTupleCountTable. Хотя его можно быстро создать на лету,
если есть много призывов хулиган, полезно предварительно вычислить файл ctab.

-regionTable (см. таблицу ниже) (DEPRECATED)
Читайте в таблице области чтения в формате HDF для маскирования частей чтения.
Это может быть одна таблица, если есть только один входной файл, или файл fofn. Когда
указана таблица регионов, любая таблица регионов внутри reads.plx.h5 или
Файлы reads.bax.h5 игнорируются.
(УСТАРЕЛО) Возможности для модифицирующий читает.

Вспомогательная информация о подстроках чтений хранится в
«таблица регионов» для каждого прочитанного файла. Поскольку используется HDF, таблица регионов может быть
часть файла .bax.h5 или .plx.h5, либо отдельный файл. Непрерывно читаемый
подстрока из шаблона является подстрокой, и любое чтение может содержать несколько
вложенные чтения. Границы подпотоков могут быть выведены из таблицы регионов.
либо напрямую, либо путем определения границ адаптера. Обычно таблицы регионов
также содержат информацию о расположении регионов высокого и низкого качества
читает. Чтения, произведенные ложными чтениями из пустых ZMW, имеют высококачественный старт.
координаты равны высокому качеству, делая чтение непригодным для использования.

-useccs
Выровняйте круговую консенсусную последовательность (ccs), затем сообщите о согласовании
ccs подчиняется окну, которому был сопоставлен ccs. Только выравнивания
сообщается о вложенных потоках.

-useccsall
Похожий на что -useccs, за исключением того, что выровнены все подпотоки, а не только
вложенные чтения, используемые для вызова ccs. Это будет включать чтения только части обложки
шаблона.

-useccsdenovo
Выровняйте круговой консенсус и сообщайте только о согласовании CC
последовательность.

-noSplitSubreads (ложный)
Не разделяйте вложенные потоки на адаптерах. Обычно это полезно только тогда, когда
геном в развернутой версии известного шаблона и содержит шаблон-
последовательность адаптер-reverse_template.

-ignoreRegions (ложный)
Игнорируйте любую информацию в таблице регионов.

-игнорироватьHQRegions (ложный)
Игнорируйте любые hq-регионы в таблице регионов.
Трассы к Отчет

-лучший n (10)
Сообщить о вершине n выравнивания.

-hitPolicy (все)
Укажите политику для обработки нескольких обращений из [all, allbest, random,
randombest, крайний левый]

ВСЕ сообщать обо всех выравниваниях.

всего найлучшего
сообщать обо всех одинаково набравших наибольшее количество баллов.

случайный сообщить о случайном совпадении.

рандомбест
сообщить о случайном совпадении из нескольких равных высших баллов
выравнивания.

крайний слева
сообщить о выравнивании, которое имеет лучший рейтинг и имеет
наименьшая координата отображения в любой ссылке.

-placeRepeatsСлучайно (ложный)
УСТАРЕЛО! Если истина, эквивалентно -hitPolicy рандомбест.

-случайное зерно (0)
Семя для генератора случайных чисел. По умолчанию (0) использовать текущее время в качестве начального числа.

-noSortRefinedAlignments (ложный)
После того, как кандидаты выравнивания генерируются и оцениваются через разреженную динамику
программирования, они пересчитываются с использованием локального выравнивания, которое учитывает
разные профили ошибок. Прибегание на основе местных особенностей может измениться.
порядок возврата обращений.

-allowAdjacentIndels
Если указано, смежная вставка или удаление разрешены. В противном случае,
смежные вставки и удаления объединяются в одну операцию. С использованием
значения качества для попарного выравнивания могут указывать на то, что чем выше
вероятностное выравнивание содержит соседние вставки или удаления. Текущий
такие инструменты, как GATK, не допускают этого, поэтому о них не сообщает
по умолчанию.
Результат Форматы и Файлы

-вне внешний (Терминал)
Записать вывод в внешний.

-Сэм Записать вывод в формате SAM.

-m t Если SAM не печатается, измените вывод выравнивания.

После появления t это:

0 Вывести вывод, похожий на взрывной, с соединяющими совпадающими нуклеотидами |.

1 Распечатайте только сводку: балл и поз.

2 Распечатайте в формате Compare.xml.

3 Печать в вульгарном формате (DEPRECATED).

4 Распечатайте более длинную табличную версию выравнивания.

5 Печатайте в машиночитаемом формате, читаемом
сравнитеSequences.py.

-заголовок
Распечатайте заголовок в качестве первой строки выходного файла с описанием содержимого.
каждого столбца.

-titleTable таб (НОЛЬ)
Составьте таблицу заголовков ссылочных последовательностей. Эталонные последовательности:
перечисляются по строкам, 0,1, ... Указатель ссылки печатается с выравниванием
результаты, а не полное имя ссылки. Это делает вывод кратким,
особенно, когда в именах ссылок присутствуют очень подробные заголовки.

-не выровненный файл
Показания вывода, не совпадающие с файл

-подрезание [нет|жесткий|подчитать|легонько] (никто)

Используйте no / hard / subread / soft clipping, ТОЛЬКО для вывода SAM / BAM.

-printSAMQV (ложный)
Значения качества печати для вывода SAM.

-cigarUseSeqMatch (ложный)
Строки CIGAR в выводе SAM / BAM используют '=' и 'X' для представления соответствия последовательности
и несоответствие вместо «М».
Возможности для постановка на якорь выравнивание регионы.

Это в наибольшей степени повлияет на скорость и чувствительность.

-minMatch m (12)
Минимальная длина семян. Более высокое значение minMatch ускорит выравнивание, но уменьшит
чувствительность.

-maxMatch l (бесконечность)
Прекратить сопоставление чтения с геномом, когда длина lcp достигает l. Это
полезно, когда запрос является частью ссылки, например, когда
построение попарных совмещений для сборки de novo.

-maxLCPLength l (бесконечность)
Такой же как -maxMatch.

-maxAnchorsPerPosition m (10000)
Не добавляйте якоря из позиции, если она соответствует более чем m места в
цель.

-advanceExactMatches E (0)
Еще одна уловка для ускорения выравнивания с помощью match - E меньше якорей.
Вместо того, чтобы искать якоря между считыванием и геномом на каждом этапе
позиция в чтении, когда якорь найден в позиции i при чтении
длина L, следующая позиция в чтении для поиска привязки находится в i + LE. Использовать
это при выравнивании уже собранных контигов.

-nКандидаты n (10)
Не отставать от n кандидаты на лучший расклад. Большое значение n будет
медленное отображение, потому что более медленные шаги динамического программирования применяются к
больше кластеров якорей, которые могут ограничивать скорость при чтении
очень длинный.

-согласованный (ложный)
Сопоставьте все подпотоки zmw (дыры) с самым длинным подпотоком полного прохода
zmw выровнен по. Для этого необходимо использовать таблицу регионов и регионы hq.
Эта опция работает только при чтении в базовом или импульсном формате h5.

-concordantTemplate (среднее значение)
Выберите подпоток полного прохода zmw в качестве шаблона для согласованного сопоставления.
longestsubread - использовать самый длинный подпоток полного прохода mediansubread - использовать
средний подпоток полного прохода типичный подпоток - используйте второй по длине полный
передать подпочаду, если длина самой длинной подпитки полного прохода является выбросом

-fastMaxInterval (ложный)
Быстрый поиск максимально увеличивающихся интервалов в качестве кандидатов на выравнивание. Поиск
не такой исчерпывающий, как по умолчанию, но намного быстрее.

-aggressiveIntervalCut (ложный)
Согласованно отфильтруйте бесперспективные кандидаты на выравнивание, если они есть.
хотя бы один перспективный кандидат. Если эта опция включена, хулиган is
вероятно, игнорирует короткие выравнивания элементов ALU.

-fastSDP (ложный)
Используйте быстрый эвристический алгоритм для ускорения разреженного динамического программирования.
Возможности для рафинирование Хиты

-sdpTupleSize K (11)
Используйте совпадения длины K для ускорения согласования динамического программирования. Этот
контролирует точность присвоения пробелов при попарном выравнивании после сопоставления
была обнаружена, а не картографирование самой чувствительности.

-scoreMatrix Гол матрица string
Укажите альтернативную матрицу оценок для оценки прочтений Fasta. Матрица
в формате

ACGTN
Abcde
C fghij
G klmno
T pqrst
N uvwxy

Значения a ... y следует вводить в виде строки, разделенной кавычками: "abc
... y ". Чем меньше количество очков, тем лучше, поэтому совпадений должно быть меньше несовпадений.
например, a, g, m, s = -5 (совпадение), несовпадение = 6.

-affineOpen ценностное (10)
Установите штраф за открытие аффинного расклада.

-affineExtend a (0)
Измените штраф за аффинный (расширенный) пробел. Чем ниже значение, тем больше промежутков.
Возможности для перекрытие / динамическое Программирование выравнивание и попарно перекрытие для de новое
сборка.

-useQuality (ложный)
Используйте значения качества замены / вставки / удаления / слияния для оценки разрыва и
штрафы за несовпадение при попарном выравнивании. Поскольку прошивка и
процент удаления намного выше, чем замена, это заставит многих
выравнивания предпочитают вставку / удаление замене. nNaive консенсус
тогда вызывающие методы часто пропускают полиморфизмы подстановки. Этот вариант
следует использовать при вызове консенсуса с помощью метода Quiver. Более того,
когда не используются значения качества для оценки выравниваний, будет более низкая
согласованная точность в областях гомолимера.

-affineAlign (ложный)
Уточните выравнивание с помощью аффинного направленного выравнивания.
Возможности для фильтрация читает и выравнивание

-minReadLength l (50)
Пропускать чтения, длина которых меньше l. Подзадачи могут быть короче.

-minSubreadLength l (0)
Не выравнивайте вложенные потоки длиной менее l.

-minRawSubreadScore m (0)
Не выравнивайте вложенные потоки, оценка качества которых в таблице регионов меньше, чем m
(показатели качества должны быть в диапазоне [0, 1000]).

-maxScore m (-200)
Максимальный балл для вывода (высокий - плохо, отрицательный - хорошо).

-minAlnLength
(0) Сообщайте о выравниваниях, только если их длина больше minAlnLength.

-minPctSimilarity (0) Сообщайте о сопоставлениях, только если их процентное соответствие
больше чем minPctSimilarity.

-minPctAccuracy
(0) Сообщайте о выравниваниях только в том случае, если их процентная точность больше, чем
minТочность.
Возможности для параллельно выравнивание

-nproc N (1)
Выровняйте с помощью N процессы. Все большие структуры данных, такие как массив суффиксов
и таблица подсчета кортежей являются общими.

-Начало S (0)
Индекс первого чтения для начала выравнивания. Это полезно, когда несколько
экземпляры работают с одними и теми же данными, например, когда они находятся в нескольких стойках
.

-шагать S (1)
Выровнять по одному чтению каждые S читает.
Возможности для подвыборка читает.

-подвыборка (0)
Доля считываний для случайной подвыборки (выраженная в виде десятичной дроби) и
выровнять.

-holeNumbers СПИСОК
Если указано, выравнивать только те чтения, номера отверстий ZMW которых находятся в СПИСОК. СПИСОК
представляет собой строку диапазонов, разделенных запятыми, например «1,2,3,10-13». Этот вариант
работает только при чтении в формате bam, bax.h5 или plx.h5.

-h Распечатать справочную информацию.

QUOTE


Чтобы процитировать BLASR, используйте: Chaisson MJ и Tesler G., Mapping singlelelelele.
секвенирование чтений с использованием базового локального выравнивания с последовательным уточнением (BLASR): теория
и приложение, BMC Bioinformatics 2012, 13: 238.

Используйте blasr онлайн с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

Команды Linux

Ad




×
Реклама
❤️Совершайте покупки, бронируйте или заказывайте здесь — никаких затрат, что помогает поддерживать бесплатность услуг.