англійськафранцузькийіспанська

Запуск серверів | Ubuntu > | Fedora > |


Значок OnWorks

map2slimp - онлайн у хмарі

Запустіть map2slimp у постачальника безкоштовного хостингу OnWorks через Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

Це команда map2slimp, яку можна запустити в постачальнику безкоштовного хостингу OnWorks, використовуючи одну з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн- емулятор Windows або онлайн-емулятор MAC OS

ПРОГРАМА:

ІМ'Я


map2slim - картує асоціації генів у «тонку» онтологію

СИНТАКСИС


CD go
map2slim GO_slims/goslim_generic.obo ontology/gene_ontology.obo gene-associations/gene_association.fb

ОПИС


Враховуючи тонкий файл GO і поточну онтологію (в одному або кількох файлах), цей сценарій буде відображено
файл асоціації генів (містить анотації до повного GO) до термінів у GO
струнка.

Сценарій можна використовувати для створення нового файлу асоціації генів, що містить найбільше
відповідних GO slim примірників, або в режимі підрахунку, у цьому випадку це дасть відмінний ген
продукт враховується для кожного тонкого терміну

Формат файлу асоціації описаний тут:

<http://www.geneontology.org/GO.annotation.shtml#файл>

АРГУМЕНТИ


-b відро стрункий файл
Цей аргумент додає відро умови до тонкої онтології; дивіться документацію нижче
пояснення. Буде записаний новий файл тонкої онтології, включаючи терміни сегмента
відро стрункий файл

- перевершити стрункий відображення файл
Це створить файл зіставлення для кожного терміна в повній онтології, що показує обидва
найбільш доречний slim термін і всі slim терміни, які є предками. Якщо ви використовуєте це
варіант, НЕ надавайте файл асоціацій генів

showames
(Працює лише з -outmap)

Покажіть назви термінів у файлі тонкого відображення

-c Це змусить map2slim давати кількість файлів асоційованого, а не відображати його

-t При використанні разом з -c відобразить відступ
ієрархія дерева у файлі slim

-o з файл
Це запише зіставлені associ (або counts) у вказаний файл, а не в
екран

СКАЧАТИ


Цей сценарій є частиною go-perl пакет, доступний у CPAN

<http://search.cpan.org/~cmungall/go-perl/>

Цей скрипт не працюватиме без встановлення go-perl

СКАСУВАННЯ АЛГОРИТМ
GO – це DAG, а не дерево. Це означає, що часто існує більше одного шляху від терміну GO
до кореневого вузла Gene_Ontology; шлях може перетинатися з кількома доданками в slim
онтологія - це означає, що одна анотація може співставлятися з кількома тонкими термінами!

(увагу вам потрібно переглянути це онлайн, щоб побачити зображення нижче - якщо ви не переглядаєте його
la http://www.geneontology.org сайту, ви можете переглянути таку URL-адресу:
<http://geneontology.cvs.sourceforge.net/*checkout*/geneontology/go-dev/go-perl/doc/map2slim.gif>
)

Гіпотетичний приклад сині кола показують терміни в GO slim, а жовті кола показують
термінів у повній онтології. Повна онтологія включає тонке, тому сині терміни
також в онтології.

ПЕРЕЙТИ ІД КАРТИ ДО СЛІМ ІД ВСІХ ПРЕДКІВ СЛІМ
===== =============== ===================
5 2+3 2,3,1
6 3 тільки 3,1
7 4 тільки 4,3,1
8 3 тільки 3,1
9 4 тільки 4,3,1
10 2+3 2,3,1

2-й стовпець показує найбільш відповідні ідентифікатори в тонкому прямому відображенні. 3-й
стовпець показує всіх предків у slim.

Зверніть, зокрема, на відображення ID 9, хоча воно має два шляхи до кореня
тонкий через 3 і 4, 3 відкидається, оскільки включається до 4.

З іншого боку, 10 відображаються як на 2, так і на 3, оскільки обидва вони є першим тонким ідентифікатором у
два дійсні шляхи до кореня, і жоден не включає інший.

Використовується такий алгоритм:

щоб відобразити будь-який один термін у повній онтології: знайдіть усі дійсні шляхи до кореневого вузла в
повна онтологія

для кожного шляху візьміть перший тонкий термін, який зустрічається на шляху

відкиньте будь-які надлишкові тонкі терміни в цьому наборі, тобто тонкі терміни, включені до інших тонких термінів
у наборі

ВІДРО TERMS
Якщо ви запустите сценарій з опцією -b, будуть додані терміни сегмента. Для будь-якого доданка P in
slim, якщо P має принаймні одну дочірню C, під P буде створений термін P'.
загальний термін для відображення будь-якого терміну в повній онтології, який є нащадком P, але
НЕ є нащадком жодної дитини P у тонкій онтології.

Наприклад, slim generic.0208 має такі терміни та структуру:

% зв'язування ДНК; GO: 0003677
% зв'язування хроматину; GO: 0003682
% активність фактора транскрипції ; GO:0003700, GO:0000130

Після додавання термінів сегмента це буде виглядати так:

% зв'язування ДНК; GO: 0003677
% зв'язування хроматину; GO: 0003682
% активність фактора транскрипції ; GO:0003700 ; синонім:GO:0000130
@bucket:Z-OTHER-Зв'язування ДНК ; slim_temp_id:12

Терміни з повної онтології, які є іншими дітьми зв’язування ДНК, наприклад,
зв'язування ланцюгової ДНК та її нащадків буде відображено на термін.

Термін сегмента має тонкий ідентифікатор, який є тимчасовим і призначений лише для полегшення
відображення. Його не слід застосовувати зовнішньо.

Термін відро має префікс Z-OTHER; Z – це хитрість, щоб переконатися, що термін є
завжди в списку останніх в алфавітному порядку.

Алгоритм дещо змінюється, якщо використовуються терміни сегмента. Термін відро має
неявне відношення до ВСІХ ІНШИХ братів і сестер не в тонкому.

Do I необхідність відро терміни?

Сьогодні більшість тонких файлів повністю або майже «завершені», тобто немає пробілів.
Це означає, що параметр -b не дасть помітних різних результатів. Наприклад,
ви можете побачити створений термін "ІНШЕ" без жодних приміток: тому що все
діти зв'язування в GO представлені в тонкому файлі.

Параметр bucket дійсно необхідний лише для деяких старих заархівованих тонких файлів,
які є статичними і були створені досить випадковим способом; вони мають тенденцію накопичувати «прогалини»
з часом (наприклад, GO додасть нову дочірню частину прив’язки, але статичний тонкий файл не буде
дату, тож будь-які генні продукти, анотовані до цього нового терміну, будуть відображатися на ІНШЕ зв’язування в
стрункий)

ГРАФ ПІДХОДИ
Зауважте, що файли тонкої онтології можуть бути застарілими щодо поточного
онтологія.

Наразі map2slim не позначає невідповідності графіка між тонким графіком і графіком у
повний файл онтології; він приймає повну онтологію як реальний граф. Однак,
тонка онтологія буде використовуватися для форматування результатів, якщо ви виберете -t -c як варіанти.

ВИХІД
У звичайному режимі буде записаний файл асоціації генів стандартного формату. Стовпець GO ID
(5) міститиме ідентифікатори GO slim. Відображення відповідає 2-му стовпцю таблиці
вище. Зверніть увагу, що вихідний файл може містити більше рядків, ніж вхідний файл. Це
оскільки деякі повні ідентифікатори GO мають більше одного відповідного slim ID.

COUNT РЕЖИМ

map2slim можна запустити з опцією -c, яка надасть кількість різних генів
продукти, зіставлені з кожним тонким терміном. Стовпчики виглядають наступним чином

GO Термін
Перший стовпець – це ідентифікатор GO, за яким слідує назва терміну (назва терміна надається як
він зустрічається як у повній GO, так і в тонких онтологіях - зазвичай вони однакові
але іноді тонкий файл буде відставати від змін у файлі GO)

Кількість генних продуктів, для яких цей термін є найбільш релевантним
кількість окремих генних продуктів, для яких це найбільш доречно/пряме лім
ID. Під найбільш прямим ми маємо на увазі, що або асоціація здійснюється безпосередньо з цим терміном,
АБО асоціація створюється з дитиною цього худорлявого віку І немає дитини стрункої
термін, на який відповідає асоціація.

Для більшості струнких цей підрахунок буде еквівалентним безпосередньо кількості асоціацій
зіставляється з цим тонким терміном. Однак деякі старіші файли тонкого формату є «плямистими» тим, що вони
визнати «прогалини». Наприклад, якщо у струнких є всі діти «біологічного процесу» с
за винятком "поведінки", тоді всі анотації до "поведінки" або його дочірніх будуть
враховано тут

див. приклад нижче

Кількість генних продуктів, як передбачається, пов’язана з строгим терміном
і кількість окремих генних продуктів, які анотовані будь-якому нащадку цього
slim ID (або анотований безпосередньо до slim ID).

прапор застарілості
Онтологія GO

Щоб взяти приклад; якщо ми використовуємо -t і -c так:

map2slim -t -c GO_slims/goslim_generic.obo ontology/gene_ontology.obo gene-associations/gene_association.fb

Тоді частина результатів може виглядати так:

GO:0008150 біологічний_процес (біологічний_процес) 34 10025 біологічний_процес
GO:0007610 поведінка (поведінка) 632 632 біологічний_процес
GO:0000004 біологічний процес невідомий (біологічний процес невідомий) 832 832 біологічний_процес
GO:0007154 стільниковий зв'язок (стільниковий зв'язок) 333 1701 біологічний_процес
GO:0008037 розпізнавання клітин (розпізнавання клітин) 19 19 біологічний_процес
19 продуктів було зіставлено з GO:0008037 або одним із його дочірніх. (GO:0008037 – це листовий вузол у сліму, тому ці два показники ідентичні).

З іншого боку, GO:0008150 отримує лише 34 продукти, для яких це найбільш актуально
термін. Це пов’язано з тим, що більшість анотацій буде відображатися з дочірнім елементом GO:0008150 у slim,
наприклад GO:0007610 (поведінка). Ці 34 генні продукти або безпосередньо анотовані
GO:0008150, або до якоїсь дитини цього терміну, яка не в тонусі. Це може вказувати на
«прогалини» в тонкому. Зауважте, що запуск map2slim з опцією -b «заповнить» ці прогалини
з умовами штучного наповнювача.

Використовуйте map2slimp онлайн за допомогою служб onworks.net


Ad


Ad