Это команда gtf2gff3p, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
gtf2gff3 - конвертирует файлы в формате GTF в допустимые файлы GFF3.
Версия
В этом документе описывается версия 0.1
СИНТАКСИС
gtf2gff3 --cfg gtf2gff3_MY_CONFIG.cfg gtf_file> gff3_file
ОПИСАНИЕ
Этот скрипт преобразует файлы в формате GTF в допустимые файлы в формате GFF3. Это будет карта
значение в столбце 3 (столбец \ "тип \") для действительного SO, но поскольку многие нестандартные термины
может появиться в этом столбце в файлах GTF, вы можете отредактировать файл конфигурации, чтобы указать свой собственный
Функция GTF для сопоставления SO. Скрипт также будет строить генные модели из экзонов, CDS и
другие функции, указанные в файле GTF. В настоящее время тестируется на Ensemble и Twinscan.
GTF, и он должен работать с любыми другими файлами, которые соответствуют той же спецификации. Оно делает
не работают с GTF из браузера таблиц UCSC, потому что эти файлы используют один и тот же идентификатор для гена
и транскрипт, поэтому невозможно сгруппировать несколько транскриптов в ген. Увидеть
README, поставляемый со сценарием, для получения дополнительной информации.
ОПЦИИ:
--cfg
Укажите имя файла конфигурации. См. Файл конфигурации, прилагаемый к этому
скрипт для деталей формата. Используйте этот файл конфигурации, чтобы изменить поведение
сценарий. Если файл конфигурации не указан, он ищет ./gtf2gff3.cfg, ~ / gtf2gff3.cfg or
/etc/gtf2gff3.cfg в таком порядке.
--Помогите
Предоставьте подробное справочное сообщение по стилю страницы руководства и затем выйдите.
ДИАГНОСТИКИ
«ОШИБКА: атрибуты отсутствуют или нестандартны: parse_attributes»
Строка в файле GTF не имела атрибутов, или ее столбец атрибутов был
неразборчивый.
"ОШИБКА: функция гена без транскрипции не поддерживается. Свяжитесь с автором для получения поддержки:
build_gene "
Это предупреждение указывает на то, что строка была пропущена из-за отсутствия расшифровки стенограммы.
gen, и код в настоящее время не оборудован для обработки этого типа функции.
Это, вероятно, не так уж сложно добавить, поэтому свяжитесь со мной, если вы получите эту ошибку и
хотелось бы, чтобы эти функции поддерживались.
«ОШИБКА: для построения транскрипта необходимо наличие как минимум экзонов или CDS: build_trnsc»
У некоторой функции был transcript_id, но при этом не было экзонов или CDS, связанных с
этот transcript_id, поэтому скрипту не удалось создать стенограмму.
"ОШИБКА: конфликт seq_id: validate_and_finish_trnsc"
Обнаружены две функции в одной расшифровке, которые не имеют одного и того же seq_id.
«ОШИБКА: конфликт источника: validate_and_finish_trnsc»
Обнаружены две особенности в одной расшифровке стенограммы, которые не имеют одного и того же источника.
«ОШИБКА: конфликт типов: validate_and_finish_trnsc»
Обнаружены две функции в одной и той же расшифровке стенограммы, которые должны были иметь одинаковые
типа, а они этого не сделали.
"ОШИБКА: конфликт цепей: validate_and_finish_trnsc"
Обнаружены две особенности в одной и той же расшифровке стенограммы, которые не имеют одной и той же нити.
«ОШИБКА: конфликт seq_id: validate_and_build_gene»
Обнаружены две особенности одного и того же гена, которые не имеют одного и того же seq_id.
«ОШИБКА: конфликт источника: validate_and_build_gene»
Обнаружены две особенности одного и того же гена, которые не имеют одного и того же источника.
"ОШИБКА: конфликт цепей: validate_and_build_gene"
Обнаружены две особенности одного и того же гена, которые не имеют одной и той же цепи.
"ОШИБКА: конфликт идентификаторов генов: validate_and_build_gene"
Обнаружены две особенности одного и того же гена, которые не имеют одного и того же gene_id.
«FATAL: не удается открыть файл GTF: имя_файла для чтения».
Невозможно открыть файл GTF для чтения.
«FATAL: нужны экзоны или CDS для построения транскриптов: process_start»
Признак start_codon был аннотирован, но при этом не было ассоциированных экзонов или CDS.
с этим transcript_id, поэтому сценарий не удался.
«FATAL: непроверенный код в process_start. Обратитесь в aurthor за поддержкой».
Сценарий написан для определения стартового кодона на основе присутствия 5 'UTR, но мы
когда мы писали код, у нас не было примера GTF этого типа, поэтому мы скорее убили процесс
чем запускать непроверенный код. Обратитесь к автору за поддержкой.
«FATAL: недопустимый набор функций: process_start»
Мы попытались рассмотреть все возможные способы определения стартового кодона или не
кодирующий ген, и все же мы потерпели неудачу. Ваша комбинация генных характеристик не делает
смысл нам. Вы никогда не должны получать эту ошибку, и если вы это сделаете, мы бы очень хотели увидеть
файл GTF, который его сгенерировал. Пожалуйста, свяжитесь с автором для поддержки.
«FATAL: нужны экзоны или CDS для построения транскриптов: process_stop»
Признак stop_codon был аннотирован, но не было экзонов или CDS, связанных с
что transcript_id, значит сценарий не удался.
«FATAL: непроверенный код в process_stop. Обратитесь в aurthor за поддержкой».
Сценарий написан для определения стоп-кодона на основе присутствия 3 'UTR, но мы
когда мы писали код, у нас не было примера GTF этого типа, поэтому мы скорее убили процесс
чем запускать непроверенный код. Обратитесь к автору за поддержкой.
«FATAL: недопустимый набор функций: process_stop»
Мы попытались рассмотреть все возможные способы определения стоп-кодона или не
кодирующий ген, и все же мы потерпели неудачу. Ваша комбинация генных характеристик не делает
смысл нам. Вы никогда не должны получать эту ошибку, и если вы это сделаете, мы бы очень хотели увидеть
файл GTF, который его сгенерировал. Пожалуйста, свяжитесь с автором для поддержки.
«FATAL: неверный набор функций: process_exon_CDS_UTR»
Мы попытались рассмотреть все возможные способы определения экзонов, CDS и UTR, и все же мы
не смогли. Ваша комбинация генных характеристик не имеет для нас смысла. Ты настоящий
должны когда-либо получить эту ошибку, и если вы это сделаете, мы бы очень хотели увидеть файл GTF, который
сгенерировал это. Пожалуйста, свяжитесь с автором для поддержки.
«FATAL: требуется ссылка на массив: sort_features.»
Пользователь не может вызвать эту ошибку. Это почти наверняка указывает на
программная ошибка. Пожалуйста, свяжитесь с автором.
"FATAL: невозможно определить цепочку в: sort_feature_types."
Это может означать, что ваш файл GTF не указывает цепочку для функций, которые
требуется это. Это также может указывать на программную ошибку. Пожалуйста, свяжитесь с автором.
«FATAL: требуется ссылка на хэш: sort_feature_types.»
Пользователь не может вызвать эту ошибку. Это почти наверняка указывает на
программная ошибка. Пожалуйста, свяжитесь с автором.
"FATAL: Неверное значение передано strand: strand."
Это может означать, что ваш файл GTF не указывает цепочку для функций, которые
требуют этого. Рассмотрите возможность использования параметра DEFAULT_STRAND в файле конфигурации. Это может
также указывают на программную ошибку. Пожалуйста, свяжитесь с автором.
КОНФИГУРАЦИЯ И ОКРУЖАЮЩАЯ СРЕДА
Файл конфигурации предоставляется вместе с этим сценарием. Скрипт будет искать это
файл конфигурации в ./gtf2gff3.cfg, ~ / gtf2gff3.cfg или /etc/gtf2gff3.cfg в таком порядке.
Если файл конфигурации не найден в одном из этих расположений и не предоставлен
с помощью флага --cfg он попытается выбрать некоторые разумные значения по умолчанию, но вы действительно должны предоставить
файл конфигурации. См. Прилагаемый файл конфигурации, а также README
который поставляется с этим пакетом, для формата и подробностей о файле конфигурации.
ЗАВИСИМОСТИ
Для этого сценария требуются следующие пакеты perl, доступные на CPAN.
(www.cpan.org).
Getopt :: Long; используйте Config :: Std;
НЕСОВМЕСТИМОСТЬ
Ничего не сообщалось.
Используйте gtf2gff3p в Интернете с помощью сервисов onworks.net