АнглийскийФранцузскийНемецкийИтальянскийПортугальскийРусскийИспанский

Значок OnWorks

map2slimp - Интернет в облаке

Запустите map2slimp в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда map2slimp, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


map2slim - отображает ассоциации генов в "тонкую" онтологию

СИНТАКСИС


cd go
map2slim GO_slims / goslim_generic.obo онтология / gene_ontology.obo генные ассоциации / gene_association.fb

ОПИСАНИЕ


Учитывая тонкий файл GO и текущую онтологию (в одном или нескольких файлах), этот сценарий будет отображать
файл ассоциации генов (содержащий аннотации к полному GO) к терминам в GO
стройное.

Сценарий можно использовать для создания нового файла ассоциации генов, содержащего наиболее
подходящие образцы GO slim или в режиме подсчета, и в этом случае он даст отдельный ген
количество продуктов для каждого небольшого срока

Формат файла ассоциации описан здесь:

<http://www.geneontology.org/GO.annotation.shtml# файл>

АРГУМЕНТЫ


-b ведро стройное файл
Этот аргумент добавляет ведро условия к тонкой онтологии; см. документацию ниже для
объяснение. Новый тонкий файл онтологии, включая термины корзины, будет записан в
ведро стройное файл

-outmap стройное отображение файл
Это создаст файл сопоставления для каждого термина в полной онтологии, показывающий как
наиболее подходящий тонкий термин и все тонкие термины, которые являются предками. Если вы используете это
вариант, НЕ предоставляйте файл ассоциаций генов

показанные имена
(Работает только с -outmap)

Показать названия термина в файле тонкого сопоставления

-c Это заставит map2slim выдавать количество ассоциативного файла, а не отображать его

-t При использовании вместе с -c будет вкладывать вывод так, чтобы отступ отражал
иерархия дерева в тонком файле

-o вне файл
Это приведет к записи сопоставленных ассоциаций (или счетчиков) в указанный файл, а не в
экран

СКАЧАТЬ


Этот сценарий является частью Go-Perl пакет, доступный в CPAN

<http://search.cpan.org/~cmungall/go-perl/>

Этот скрипт не будет работать без установки go-perl

ОТОБРАЖЕНИЕ ALGORITHM / АЛГОРИТМ
GO - это DAG, а не дерево. Это означает, что от термина GO часто бывает несколько путей.
до корневого узла Gene_Ontology; путь может пересекать несколько членов в тонком
онтология - это означает, что одна аннотация может отображаться на несколько тонких терминов!

(внимание вам нужно просмотреть это в Интернете, чтобы увидеть изображение ниже - если вы не просматриваете это на
что собой представляет http://www.geneontology.org site вы можете посмотреть по следующему URL:
<http://geneontology.cvs.sourceforge.net/* оформление заказа * / geneontology / go-dev / go-perl / doc / map2slim.gif>
)

Гипотетический пример: синие кружки показывают термины в GO slim, а желтые кружки показывают
термины в полной онтологии. Полная онтология включает в себя тонкое, поэтому синие термины
также в онтологии.

GO ID КАРТЫ ДЛЯ SLIM ID ВСЕХ SLIM ПРЕДКОВ
===== =============== ==================
5 2 + 3 2,3,1
6 3 только 3,1
7 4 только 4,3,1
8 3 только 3,1
9 4 только 4,3,1
10 2 + 3 2,3,1

Во 2-м столбце показаны наиболее подходящие идентификаторы в тонком прямом отображении. 3-й
столбец показывает всех предков в слим.

Обратите внимание, в частности, на отображение ID 9, хотя у него есть два пути к корню через
тонкие переходы 3 и 4, 3 отбрасываются, потому что они подпадают под 4.

С другой стороны, 10 соответствует как 2, так и 3, потому что они оба являются первыми тонкими идентификаторами в
два действительных пути к корню, и ни один из них не включает другой.

Используемый алгоритм:

для отображения любого термина в полной онтологии: найти все допустимые пути до корневого узла в
полная онтология

для каждого пути возьмите первый тонкий термин, встречающийся на пути

отказаться от любых избыточных тонких терминов в этом наборе, то есть тонких терминов, включенных в другие тонкие термины
в наборе

ВЕДРО СРОКИ
Если вы запустите сценарий с параметром -b, будут добавлены условия корзины. Для любого члена P в
тонкий, если у P есть хотя бы один дочерний элемент C, термин корзины P 'будет создан под P. Это
универсальный термин для отображения любого термина в полной онтологии, который является потомком P, но
НЕ является потомком какого-либо потомка P в тонкой онтологии.

Например, тонкий generic.0208 имеет следующие термины и структуру:

% Связывания ДНК; ПЕРЕЙТИ: 0003677
% связывания хроматина; ИДТИ: 0003682
% активности фактора транскрипции; GO: 0003700, GO: 0000130

После добавления условий корзины это будет выглядеть так:

% Связывания ДНК; ПЕРЕЙТИ: 0003677
% связывания хроматина; ИДТИ: 0003682
% активности фактора транскрипции; GO: 0003700; синоним: GO: 0000130
@bucket: связывание Z-OTHER-ДНК; slim_temp_id: 12

Термины из полной онтологии, которые являются другими дочерними элементами связывания ДНК, такие как single-
Связывание цепной ДНК и ее потомки будут отображаться в термин корзины.

Термин ведра имеет тонкий идентификатор, который является временным и предназначен только для облегчения
отображение. Не следует использовать наружно.

Термин сегмента имеет префикс Z-OTHER; Z - это хитрость, чтобы убедиться, что термин
всегда указывается последним в алфавитном порядке.

Алгоритм немного изменяется, если используются термины корзины. У термина "ведро" есть
неявное отношение ко всем ДРУГИМ братьям и сестрам не в тонком.

Do I необходимость ведро сроки?

В настоящее время большинство тонких файлов полностью или почти «завершено», то есть нет никаких пропусков.
Это означает, что опция -b не приведет к заметным отличиям от результатов. Например,
вы можете увидеть, что создается термин "привязка" OTHER, без каких-либо аннотаций к нему: потому что все
дочерние элементы привязки в GO представлены в тонком файле.

Вариант корзины действительно необходим только для некоторых старых заархивированных тонких файлов,
статические и сгенерированные произвольно; они имеют тенденцию накапливать «пробелы»
со временем (например, GO добавит новый дочерний элемент привязки, но статический тонкий файл не будет соответствовать
дату, поэтому любые генные продукты, аннотированные этим новым термином, будут отображаться в ДРУГОЙ-привязке в
стройное)

GRAPH Несоответствия
Обратите внимание, что файл (ы) тонкой онтологии может быть устаревшим по сравнению с текущим
онтология.

В настоящее время map2slim не помечает несоответствия графиков между узким графиком и графиком в
полный файл онтологии; он принимает полную онтологию как реальный граф. Однако
тонкая онтология будет использоваться для форматирования результатов, если вы выберете -t -c как варианты.

ВЫВОД
В обычном режиме будет записан файл ассоциации генов стандартного формата. Столбец GO ID
(5) будет содержать идентификаторы GO slim. Отображение соответствует 2-му столбцу в таблице.
выше. Обратите внимание, что выходной файл может содержать больше строк, чем входной. Это
потому что некоторые полные идентификаторы GO имеют более одного подходящего тонкого идентификатора.

СЧИТАТЬ РЕЖИМ

map2slim можно запустить с параметром -c, который даст количество отдельных генов
продукты, сопоставленные с каждым тонким термином. Столбцы следующие

GO Срок
Первый столбец - это идентификатор GO, за которым следует имя термина (имя термина предоставляется как
он находится как в полной онтологии GO, так и в тонкой онтологии - обычно это одно и то же
но иногда тонкий файл будет отставать от изменений в файле GO)

Подсчет генных продуктов, для которых это наиболее актуальный тонкий термин
количество отдельных генных продуктов, для которых это наиболее уместно / прямое сокращение
Я БЫ. Под самым прямым мы подразумеваем, что либо связь устанавливается непосредственно с этим термином, либо
ИЛИ этот тонкий термин ассоциируется с ребенком, И нет такого ребенка
термин, которому сопоставляется ассоциация.

Для большинства слимов это количество будет эквивалентно количеству ассоциаций напрямую.
сопоставлен с этим тонким термином. Однако некоторые старые тонкие файлы "пятнистые" в том смысле, что они
допускаю «пробелы». Например, если у стройной есть все дети «биологического процесса» с
за исключением «поведения», тогда все аннотации к «поведению» или его дочерним элементам будут
подсчитано здесь

см. пример ниже

Количество генных продуктов, предположительно связанных с тонким термином
и количество различных генных продуктов, которые аннотированы для любого потомка этого
slim ID (или с аннотациями непосредственно к Slim ID).

флаг устаревания
Онтология GO

Чтобы взять пример; если мы используем -t и -c вот так:

map2slim -t -c GO_slims / goslim_generic.obo онтология / gene_ontology.obo генные ассоциации / gene_association.fb

Тогда часть результатов может выглядеть так:

GO: 0008150 биологический_процесс (биологический_процесс) 34 10025 биологический_процесс
GO: 0007610 поведение (поведение) 632 632 биологический_процесс
GO: 0000004 биологический процесс неизвестен (биологический процесс неизвестен) 832 832 биологический_процесс
GO: 0007154 клеточная коммуникация (клеточная коммуникация) 333 1701 биологический_процесс
GO: 0008037 распознавание клеток (распознавание клеток) 19 19 биологический_процесс
19 продуктов были сопоставлены с GO: 0008037 или одним из его дочерних элементов. (GO: 0008037 - листовой узел в Slim, поэтому два счетчика идентичны).

С другой стороны, GO: 0008150 получает только 34 продукта, для которых это наиболее актуально.
срок. Это связано с тем, что большинство аннотаций будет отображаться на некоторый дочерний элемент GO: 0008150 в тонком,
например GO: 0007610 (поведение). Эти 34 генных продукта либо напрямую аннотированы
GO: 0008150, или какому-нибудь ребенку этого термина, которого нет в тонкости. Это может указывать на
«пробелы» в тонком. Обратите внимание, что запуск map2slim с параметром -b «заткнет» эти пробелы.
с искусственным наполнителем на условиях.

Используйте map2slimp онлайн с помощью сервисов onworks.net


Ad


Ad

Новейшие онлайн-программы для Linux и Windows