Это команда abyss-pe, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
abyss-pe - ассемблировать читает в контиги
СИНТАКСИС
бездна [ВАРИАНТ] ... [ПАРАМЕТР=VALUE] ... [MAKE_TARGET] ...
ОПИСАНИЕ
Соберите чтения входных файлов в контиги. Чтения могут быть в FASTA, FASTQ,
qseq, экспорт, формат SRA, SAM или BAM и может быть сжат с помощью gz, bz2 или xz и может быть
просмоленный.
abyss-pe - это сценарий Makefile. Также с abyss-pe можно использовать любые варианты изготовления.
параметры of бездна
имя, НАЗВАНИЕ РАБОТЫ
Имя этой сборки. Полученные строительные леса будут храниться в
$ {name} -scaffolds.fa.
in входные файлы. Используйте эту переменную при сборке данных из одной библиотеки.
Lib список в кавычках парных имен библиотек, разделенных пробелами. Используйте эту переменную
при сборке данных из нескольких парных библиотек. Для каждого имени библиотеки в
lib, пользователь должен определить переменную в командной строке с тем же именем, которая
указывает файлы для чтения для этой библиотеки. Видеть ПРИМЕРЫ ниже для бетона
пример использования.
pe список парных библиотек, которые будут использоваться только для слияния юнитов в
contigs и не будет способствовать согласованной последовательности.
mp список библиотек сопряженных пар, которые будут использоваться для строительных лесов. Библиотеки сопряженных пар
не вносят вклад в согласованную последовательность.
длинной список библиотек длинных последовательностей, которые будут использоваться для переналадки. длинная последовательность
библиотеки не вносят вклад в согласованную последовательность.
se файлы, содержащие односторонние чтения
a максимальное количество ветвей пузыря [2]
b максимальная длина пузыря (п.н.) [10000]
c минимальное среднее k-мерное покрытие единицы [SQRT(медиана)]
d допустимая погрешность оценки расстояния (bp) [6]
e минимальное эрозионное покрытие k-mer [SQRT(медиана)]
E минимальное покрытие эрозией k-mer на прядь [1]
j количество потоков [2]
k размер k-мер (когда K не установлен) или промежуток пары k-mer (когда K установлен)
K размер одного к-мера в паре к-мер (п.н.)
l минимальная длина выравнивания чтения (bp) [k]
m минимальное перекрытие двух единиц (п.н.) [30]
n минимальное количество пар, необходимое для построения контигов [10]
N минимальное количество пар, необходимое для строительства строительных лесов [n]
p минимальная идентичность последовательности пузыря [0.9]
q минимальное качество основы при обрезке [3]
Обрезать базы с концов чтений, качество которых меньше q.
Q минимальное базовое качество [0]
Замаскируйте все базы чтений, качество которых меньше Q, как `N '.
s минимальный размер блока, необходимый для построения контигов (bp) [200]
Длина посевного материала должна быть как минимум в два раза больше значения k. Если больше последовательности
собранный больше ожидаемого размера генома, попробуйте увеличить s.
S минимальный размер контига, необходимый для строительства строительных лесов (bp) [s]
SS SS = - SS для сборки в режиме, специфичном для пряди
Требуется, чтобы все библиотеки были библиотеками RNA-Seq, специфичными для цепей. Предполагает, что
первое считывание в паре считывания - это почитаемый WRT секвенирование транскриптов.
t минимальный размер наконечника (bp) [2k]
v v = -v, чтобы включить подробное ведение журнала
np, НСЛОТЫ
количество процессов сборки MPI
мпирун путь к mpirun
выравнивать
Программа, используемая для выравнивания чтения по контигам [map].
Допустимые значения: map, kaligner, bwa, bwasw, bowtie, bowtie2, dida. Увидеть
ДИДА раздел ниже для получения дополнительной информации о параметре dida.
cs преобразовать контиги цветового пространства в контиги нуклеотидов после сборки
Опции of сделать
-n, --прогон, репетиция
Выведите команды, которые будут выполнены, но не выполняйте их.
MAKE цели для бездна
по умолчанию
Эквивалентно scaffolds scaffolds-dot stats.
юниты
Соберите юнитиги.
единица
Выведите единичный график перекрытия.
Pe-Sam Сопоставьте чтение парного конца с unitigs и выведите файл SAM. Файл SAM будет только
содержат отображение чтения на разные контиги, а также идентификатор чтения, последовательность и качество
строки будут заменены символами '*'.
пэ-бам Сопоставьте чтение парного конца с unitigs и выведите файл BAM. BAM файл будет только
содержат отображение чтения на разные контиги, а также идентификатор чтения, последовательность и качество
строки будут заменены символами '*'.
пе-индекс
Сгенерируйте индекс единиц, используемых abyss-map.
контигов
Соберите контиги.
контиг-точка
Выведите граф перекрытия контигов.
МП-Сэм Сопоставление сопряженной пары считывает контиги и выводит файл SAM. Файл SAM будет только
содержат отображение чтения на разные контиги, а также идентификатор чтения, последовательность и качество
строки будут заменены символами '*'.
мп-бац Сопоставление сопряженной пары считывает контиги и выводит файл BAM. BAM файл будет только
содержат отображение чтения на разные контиги, а также идентификатор чтения, последовательность и качество
строки будут заменены символами '*'.
mp-индекс
Сгенерируйте индекс контигов, используемых abyss-map.
строительные леса
Соберите подмости.
леса-точечные
Выведите график перекрытия каркасов.
скафтиги
Разбейте скаффолды и создайте файл AGP.
длинные леса
Перекаффолд с использованием контигов, собранных с помощью RNA-Seq.
длинные леса-точки
Выведите график перекрытия каркаса РНК.
Статистика Отобразить статистику смежности сборок.
чистым Удалите промежуточные файлы.
версия
Вывести версию abyss-pe.
версии
Показать версии всех программ, используемых abyss-pe.
помощь Показать полезное сообщение.
ДИДА
ABySS поддерживает использование DIDA (Dispatched Alignment с распределенным индексированием), основанного на MPI.
структура выравнивания для вычисления выравнивания последовательностей на нескольких машинах. Использовать
DIDA с ABySS, сначала загрузите и установите DIDA из
http://www.bcgsc.ca/platform/bioinfo/software/dida, затем укажите dida в качестве значения
что собой представляет выравнивать параметр бездна.
Связанные с DIDA бездна параметры
DIDA_MPIRUN
Команда mpirun используется для запуска заданий DIDA.
DIDA_RUN_OPTIONS
Параметры времени выполнения, такие как количество потоков на ранг MPI и значения для среды
переменные (например, PATH, LD_LIBRARY_PATH). Запустите `abyss-dida --help`, чтобы получить список
Доступные Варианты.
DIDA_OPTIONS
Параметры, которые передаются непосредственно в двоичный файл DIDA. Например, это можно использовать
для управления порогом минимальной длины выравнивания. Запустите `dida-wrapper --help` для
список доступных опций.
MPI СОВМЕСТИМОСТЬ
Из-за использования многопоточности DIDA знает проблемы с взаимоблокировкой в OpenMPI. С использованием
Библиотека MPICH MPI настоятельно рекомендуется при запуске сборок с DIDA. Тестирование
было сделано с MPICH 3.1.3, скомпилировано с --enable-thread = funneled.
ПРИМЕР
Рекомендуемая конфигурация среды выполнения для DIDA - 1 ранг MPI на машину и 1 поток на
Ядро процессора. Например, чтобы запустить сборку на 3 узлах кластера по 12 ядер в каждом, выполните:
abyss-pe k = 64 name = ecoli in = 'reads1.fa reads2.fa' aligner = dida
DIDA_RUN_OPTIONS = '- j12' DIDA_MPIRUN = 'mpirun -np 3 -ppn 1 -bind-to board'
В этом примере используются параметры командной строки MPICH для mpirun. Здесь `-np 3` указывает
количество рангов MPI, "-ppn 1" указывает количество рангов MPI на "узел", и
`-bind-to board` определяет« узел »как материнскую плату (то есть полную машину).
ОКРУЖАЮЩАЯ СРЕДА ПЕРЕМЕННЫЕ
Любой параметр, который может быть указан в командной строке, также может быть указан в
переменная среды.
PATH должен содержать каталог, в котором установлены исполняемые файлы ABySS. Используйте `abyss-
pe versions`, чтобы проверить правильность настройки PATH.
TMPDIR указывает каталог для использования для временных файлов
Планировщик интеграции.
ABySS хорошо интегрируется с планировщиками заданий кластера, такими как:
* SGE (движок солнечной сети)
* Портативная система дозирования (PBS)
* Средство распределения нагрузки (LSF)
* IBM LoadLeveler
Переменные среды SGE JOB_NAME, SGE_TASK_ID и NSLOTS могут использоваться для указания
имя параметров, k и np, соответственно, и аналогично для других планировщиков.
ПРИМЕРЫ
один парный конец библиотека
abyss-pe k = 64 name = ecoli in = 'reads1.fa reads2.fa'
множественный парный конец библиотеки
abyss-pe k = 64 имя = ecoli lib = 'lib1 lib2' \
lib1='lib1_1.fa lib1_2.fa' lib2='lib2_1.fa lib2_2.fa' \
se = 'se1.fa se2.fa'
Парный конец и пара библиотеки
abyss-pe k = 64 name = ecoli lib = 'pe1 pe2' mp = 'mp1 mp2' \
pe1='pe1_1.fa pe1_2.fa' pe2='pe2_1.fa pe2_2.fa' \
mp1='mp1_1.fa mp1_2.fa' mp2='mp2_1.fa mp2_2.fa' \
se = 'se1.fa se2.fa'
В том числе Секвенирование РНК сборки
abyss-pe k = 64 name = ecoli lib = pe1 mp = mp1 long = long1 \
pe1='pe1_1.fa pe1_2.fa' mp1='mp1_1.fa mp1_2.fa' \
long1 = long1.fa
MPI
abyss-pe np = 8 k = 64 name = ecoli in = 'reads1.fa reads2.fa'
SGE
qsub -N ecoli -t 64 -pe openmpi 8 \
abyss-pe n = 10 in = 'reads1.fa reads2.fa'
Используйте abyss-pe онлайн с помощью сервисов onworks.net