Это команда rabema_build_gold_standard, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
rabema_build_gold_standard - построитель золотого стандарта RABEMA
СИНТАКСИС
rabema_build_gold_standard [ОПЦИИ] --out-gsi OUT.gsi --ссылка REF.fa --ин-сам
ИДЕАЛЬНЫЙ.sam rabema_build_gold_standard [ОПЦИИ] --out-gsi OUT.gsi --ссылка
REF.fa --ин-бац ИДЕАЛЬНО.бам
ОПИСАНИЕ
Эта программа позволяет создать золотой стандарт RABEMA. На входе указана ссылка FASTA.
файл и идеальную карту SAM / BAM (например, созданную с помощью RazerS 3 с полной чувствительностью
Режим).
Входной файл SAM / BAM должен быть отсортирован по координатам. Программа создаст
Индексный файл FASTA REF.fa.fai для быстрого произвольного доступа к ссылке.
-h, --Помогите
Отображает это справочное сообщение.
--версия
Отображение информации о версии
-v, --подробный
Включить подробный вывод.
-вв, - очень многословный
Включите еще более подробный вывод.
Ввод, вывод:
-o, --out-gsi GSI
Путь для записи итогового файла GSI. Допустимые типы файлов: gsi и gsi.gz.
-r, --ссылка ФАСТА
Путь для загрузки ссылки FASTA из. Допустимые типы файлов: fa и fasta.
-s, --ин-сам SAM
Путь для загрузки "идеального" файла SAM. Допустимый тип файла: sam.
-b, --ин-бац БАМ
Путь для загрузки "идеального" файла BAM. Допустимый тип файла: bam.
Параметры Золотого стандарта:
--oracle-режим
Включите режим оракула. Это используется для моделирования данных, когда входной файл SAM / BAM
дает ровно одну позицию, которая считается истинной позицией образца.
--матч-N
Если установлено, N соответствует всем символам без штрафа.
- метрика расстояния Метрическая
Установите метрику расстояния. Допустимые значения: Hamming, edit. По умолчанию: редактировать. Один из Хэмминга и
редактировать. По умолчанию: редактировать.
-e, --max-ошибка СТАВКА
Максимальный процент ошибок для построения золотого стандарта. Этот параметр является
целое число и относительно длины чтения. В случае режима оракула частота ошибок для
используется считывание в позиции выборки, а RATE используется как порог отсечки.
По умолчанию: 0.
ВОЗВРАТНАЯ СТОИМОСТЬ
Возвращаемое значение 0 указывает на успех, любое другое значение указывает на ошибку.
ПРИМЕРЫ
rabema_build_gold_standard -e 4 -o OUT.gsi -s ИН.сам -r REF.fa
Создайте золотой стандарт из файла SAM IN.sam со всеми местоположениями сопоставления и FASTA
ссылка REF.fa на файл GSI OUT.gsi с максимальной частотой ошибок 4.
rabema_build_gold_standard - метрика расстояния отредактировать -e 4 -o OUT.gsi -b ИН.бам -r
REF.fa
То же, что и выше, но с использованием Хэмминга вместо расстояния редактирования и BAM в качестве входных данных.
rabema_build_gold_standard --oracle-режим -o OUT.gsi -s ИН.сам -r REF.fa
Создайте золотой стандарт из файла SAM IN.sam с исходной позицией образца, например
как экспортировано читаем симулятором Мэйсона.
ТРЕБОВАНИЯ К ПАМЯТИ
Начиная с версии 1.1, большое внимание было уделено тому, чтобы требования к памяти были минимальными.
насколько возможно. Требуемая память в два раза превышает размер самой большой хромосомы.
плюс некоторая постоянная память для каждого матча.
Например, использование памяти для чтения генома человека размером 100 пар оснований при частоте ошибок 5% было
1.7 ГБ. Из них примерно 400 ГБ приходится на хромосому и 1.3 ГБ - на совпадения.
Ссылки
М. Хольтгреве, А.-К. Эмде, Д. Виз и К. Райнерт. Роман и хорошо определенный
Метод сравнительного анализа для карт чтения второго поколения, BMC Bioinformatics 2011,
12: 210.
http://www.seqan.de/rabema
RABEMA Домашняя страница
http://www.seqan.de/mason
Домашняя страница Мэйсона
Версия
rabema_build_gold_standard версия: 1.2.0 Последнее обновление 14 марта 2013 г.
Используйте rabema_build_gold_standard в Интернете с помощью сервисов onworks.net