Это команда bp_unflatten_seqp, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
bp_unflatten_seq - отменяет выравнивание генбанка или файла функций в стиле генбанка во вложенный
Иерархия SeqFeature
СИНТАКСИС
bp_unflatten_seq.PLS -e 3 -gff ~ / cvs / bioperl-live / t / data / AE003644_Adh-genomic.gb
bp_unflatten_seq.PLS --подробнее ~ / cvs / bioperl-live / t / data / AE003644_Adh-genomic.gb
bp_unflatten_seq.PLS -i foo.embl --from embl --to chadoxml -o out.chado.xml
bp_unflatten_seq.PLS --notypemap --detail --to asciitree -ethresh 2 AE003644_Adh-genomic.gb
ОПИСАНИЕ
Этот сценарий будет неровный Genbank или файл в стиле Genbank SeqFeatures во вложенный
иерархия.
См. Bio :: SeqFeature :: Инструменты :: Unflattener
В представлении GenBank / EMBL функции являются «плоскими» - например, нет ссылки
между мРНК и CDS, кроме неявных ссылок (например, через теги или через сайт сплайсинга)
координаты), которые может быть трудно кодировать.
Это проще всего проиллюстрировать с помощью формата вывода по умолчанию, Asciitree
Непроверенный набор функций генбанка может выглядеть так (AB077698)
Последовательность: AB077698
databank_entry 1..2701 [+]
ген
мРНК
CDS hCHCR-G 80..1144 [+]
экзон 80..1144 [+]
five_prime_UTR 1..79 [+]
Location_sequence_feature 137..196 [+]
Location_sequence_feature 239..292 [+]
Location_sequence_feature 617..676 [+]
Location_sequence_feature 725..778 [+]
three_prime_UTR 1145..2659 [+]
polyA_site 1606..1606 [+]
polyA_site 2660..2660 [+]
Или вот так (часть AE003734)
ген
мРНК CG3320-RA
CDS CG3320-PA 53126..54971 [-]
экзон 52204..53323 [-]
экзон 53404..53631 [-]
экзон 53688..53735 [-]
экзон 53798..53918 [-]
экзон 54949..55287 [-]
мРНК CG3320-RB
CDS CG3320-PB 53383..54971 [-]
экзон 52204..53631 [-]
экзон 53688..53735 [-]
экзон 53798..53918 [-]
экзон 54949..55287 [-]
Неплавка также «нормализует» иерархию сдерживания (в смысле
стандартизация - например, обеспечение наличия записи стенограммы, даже если генбанк
просто указывает CDS и ген)
По умолчанию типы GenBank будут сопоставлены с типами SO.
См. Bio :: SeqFeature :: Tools :: TypeMapper
КОМАНДА ЛИНИЯ АРГУМЕНТЫ
-i | входной ФАЙЛ
входной файл (также может быть указан в качестве последнего аргумента)
-из FORMAT
формат ввода (по умолчанию genbank)
вероятно, не имеет большого смысла использовать это для не плоских форматов; то есть кроме
эмбл / генбанк
-фОРМАТИРОВАТЬ
выходной формат (по умолчанию asciitree)
действительно должен быть формат, который учитывает вложенные SeqFeature; Я думаю это только
asciitree, chadoxml и gff3
-gff
с экспортом в формат GFF3 (до 3 GFF не имеют смысла с несглаженными последовательностями, так как
у них нет установленного способа представления графов характеристик)
-o | выходной ФАЙЛ
Outfile по умолчанию - STDOUT
-деталь
показать дополнительную информацию о функциях (только в режиме asciitree)
-e | ethresh INT
устанавливает порог ошибки при расправлении
по умолчанию этот сценарий будет шататься, если он обнаружит странные вещи в генбанке.
файл - увеличьте порог ошибок, чтобы указать, что они игнорируются (и
СТДЕРР)
-номагический
подавить use_magic в unflattener (см. Bio :: SeqFeature :: Tools :: Unflattener
-notypemap
подавить сопоставление типов (см. Bio :: SeqFeature :: Tools :: TypeMapper
TODO
Bio :: SeqFeature :: Tools :: Unflattener позволяет детально контролировать выравнивание
процесс - необходимо добавить дополнительные параметры, чтобы разрешить этот элемент управления в командной строке
СВЯЗЬ
Рассылка Списки
Отзывы пользователей - неотъемлемая часть развития этого и других модулей Bioperl. послать
Ваши комментарии и предложения желательно направлять в список рассылки Bioperl. Ваше участие
очень ценится.
[электронная почта защищена] - Обсуждение
http://bioperl.org/wiki/Mailing_lists - О списках рассылки
Отчетность ошибки
Сообщайте об ошибках в систему отслеживания ошибок Bioperl, чтобы мы могли отслеживать ошибки и их
разрешающая способность. Отчеты об ошибках можно отправлять по электронной почте или через Интернет:
https://github.com/bioperl/bioperl-live/issues
Используйте bp_unflatten_seqp в Интернете с помощью сервисов onworks.net