map2slimp - क्लाउड में ऑनलाइन

यह कमांड map2slimp है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर में से एक का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।

कार्यक्रम:

नाम


map2slim - जीन संघों को एक 'स्लिम' ऑन्कोलॉजी में मैप करता है

SYNOPSIS


सीडी जाओ
map2slim GO_slims/goslim_generic.obo ontology/gene_ontology.obo जीन-एसोसिएशंस/gene_association.fb

वर्णन


एक GO स्लिम फ़ाइल, और एक वर्तमान ऑन्कोलॉजी (एक या अधिक फ़ाइलों में) को देखते हुए, यह स्क्रिप्ट मैप करेगी
GO . में शर्तों के लिए एक जीन एसोसिएशन फ़ाइल (पूर्ण GO के लिए एनोटेशन युक्त)
पतला।

स्क्रिप्ट का उपयोग या तो एक नई जीन एसोसिएशन फ़ाइल बनाने के लिए किया जा सकता है, जिसमें सबसे अधिक
प्रासंगिक गो स्लिम एक्सेस, या काउंट-मोड में, जिस स्थिति में यह अलग जीन देगा
प्रत्येक स्लिम टर्म के लिए उत्पाद मायने रखता है

एसोसिएशन फ़ाइल स्वरूप यहाँ वर्णित है:

<http://www.geneontology.org/GO.annotation.shtml#फ़ाइल>

बहस


-b बाल्टी पतला पट्टिका
यह तर्क जोड़ता है बाल्टी शर्तों स्लिम ऑन्कोलॉजी के लिए; के लिए नीचे दिए गए दस्तावेज़ देखें
एक स्पष्टीकरण। बकेट टर्म्स सहित नई स्लिम ऑन्कोलॉजी फाइल को लिखा जाएगा
बाल्टी पतला पट्टिका

-आउटमैप पतला मानचित्रण पट्टिका
यह दोनों को दिखाते हुए पूर्ण ऑटोलॉजी में प्रत्येक शब्द के लिए मैपिंग फ़ाइल उत्पन्न करेगा
सबसे प्रासंगिक स्लिम टर्म और सभी स्लिम टर्म जो पूर्वज हैं। यदि आप इसका उपयोग करते हैं
विकल्प, जीन-एसोसिएशन फ़ाइल की आपूर्ति न करें

शोनाम
(केवल -आउटमैप के साथ काम करता है)

स्लिम मैपिंग फ़ाइल में शब्द के नाम दिखाएं

-c यह map2slim को मानचित्र के बजाय assoc फ़ाइल की गणना करने के लिए बाध्य करेगा

-t जब संयोजन के साथ प्रयोग किया जाता है -c आउटपुट को टैब करेगा ताकि इंडेंटेशन प्रतिबिंबित हो
स्लिम फ़ाइल में ट्री पदानुक्रम

-o आउट पट्टिका
यह मैप किए गए assocs (या मायने रखता है) को निर्दिष्ट फ़ाइल में लिखेगा, बजाय to
स्क्रीन

डाउनलोड


यह स्क्रिप्ट का हिस्सा है गो-पर्ली पैकेज, CPAN . से उपलब्ध है

<http://search.cpan.org/~cmungall/go-perl/>

यह स्क्रिप्ट go-perl . को स्थापित किए बिना काम नहीं करेगी

मानचित्रण कलन विधि
गो एक डीएजी है, पेड़ नहीं। इसका मतलब है कि GO शब्द से अक्सर एक से अधिक पथ होते हैं
रूट Gene_Ontology नोड तक; पथ स्लिम में कई शब्दों को काट सकता है
ऑन्कोलॉजी - जिसका अर्थ है कि एक एनोटेशन कई पतले शब्दों को मैप कर सकता है!

(नोट नीचे दिए गए चित्र को देखने के लिए आपको इसे ऑनलाइन देखना होगा - यदि आप इसे इस पर नहीं देख रहे हैं
la http://www.geneontology.org साइट, आप निम्न यूआरएल देख सकते हैं:
<http://geneontology.cvs.sourceforge.net/*चेकआउट*/जीनंटोलॉजी/गो-देव/गो-पर्ल/डॉक/मैप2slim.gif>
)

एक काल्पनिक उदाहरण नीले वृत्त GO स्लिम में शब्द दिखाते हैं, और पीले वृत्त दिखाते हैं
पूर्ण ऑन्कोलॉजी में शर्तें। पूर्ण ऑन्कोलॉजी स्लिम को समाहित करती है, इसलिए नीले शब्द हैं
ऑटोलॉजी में भी।

सभी स्लिम पूर्वजों के लिए आईडी मैप्स पर जाएं
===== ================================
5 2+3 2,3,1
6 3 केवल 3,1
7 4 केवल 4,3,1
8 3 केवल 3,1
9 4 केवल 4,3,1
10 2+3 2,3,1

दूसरा कॉलम स्लिम डायरेक्ट मैपिंग में सबसे प्रासंगिक आईडी दिखाता है। तीसरा
कॉलम स्लिम में सभी पूर्वजों को दिखाता है।

विशेष रूप से आईडी 9 की मैपिंग पर ध्यान दें, हालांकि इसके रूट के माध्यम से दो रास्ते हैं
स्लिम वाया 3 और 4, 3 को छोड़ दिया जाता है क्योंकि यह 4 से कम हो जाता है।

दूसरी ओर, 10 और 2 दोनों के लिए 3 मानचित्र, क्योंकि ये दोनों पहली स्लिम आईडी हैं
जड़ के लिए दो वैध पथ, और न ही दूसरे को समाहित करता है।

इस्तेमाल किया एल्गोरिथ्म है:

पूर्ण ऑन्कोलॉजी में किसी एक शब्द को मैप करने के लिए: रूट नोड के माध्यम से सभी वैध पथ खोजें
पूर्ण ऑन्कोलॉजी

प्रत्येक पथ के लिए, पथ में सामने आया पहला पतला शब्द लें

इस सेट में किसी भी अनावश्यक स्लिम शब्दों को छोड़ दें यानी अन्य स्लिम शब्दों द्वारा शामिल किए गए स्लिम शब्दों को छोड़ दें
सेट में

BUCKET नियम
यदि आप स्क्रिप्ट को -b विकल्प के साथ चलाते हैं, तो बकेट शब्द जोड़े जाएंगे। किसी भी पद P in . के लिए
पतला, यदि P का कम से कम एक बच्चा C है, तो P के अंतर्गत एक बकेट टर्म P' बनाया जाएगा। यह है
पूर्ण ऑन्कोलॉजी में किसी भी शब्द को मैप करने के लिए एक कैच-ऑल टर्म जो कि पी का वंशज है, लेकिन
स्लिम ऑन्कोलॉजी में P के किसी भी बच्चे का वंशज नहीं है।

उदाहरण के लिए, स्लिम जेनेरिक.0208 में निम्नलिखित नियम और संरचना है:

% डीएनए बाइंडिंग; जाओ:0003677
% क्रोमैटिन बाइंडिंग; जाओ:0003682
% प्रतिलेखन कारक गतिविधि; जाओ:0003700, जाओ:0000130

बकेट टर्म्स जोड़ने के बाद, यह इस तरह दिखेगा:

% डीएनए बाइंडिंग; जाओ:0003677
% क्रोमैटिन बाइंडिंग; जाओ:0003682
% प्रतिलेखन कारक गतिविधि; जाओ:0003700; समानार्थी: जाओ: 0000130
@bucket:Z-OTHER-DNA बाइंडिंग; स्लिम_टेम्प_आईडी:12

पूर्ण ऑन्कोलॉजी की शर्तें जो डीएनए बाइंडिंग के अन्य बच्चे हैं, जैसे एकल-
फंसे हुए डीएनए बाइंडिंग और उसके वंशज बकेट टर्म के लिए मैप करेंगे।

बकेट टर्म की एक पतली आईडी होती है जो क्षणिक होती है और केवल सुविधा प्रदान करने के लिए होती है
मानचित्रण। इसका बाहरी उपयोग नहीं करना चाहिए।

बकेट टर्म में उपसर्ग Z-OTHER है; Z यह सुनिश्चित करने के लिए एक हैक है कि शब्द है
हमेशा वर्णमाला क्रम में अंतिम सूचीबद्ध होता है।

यदि बकेट शब्दों का उपयोग किया जाता है तो एल्गोरिथ्म को थोड़ा संशोधित किया जाता है। बकेट टर्म में a . होता है
अन्य सभी भाई-बहनों के साथ निहित संबंध स्लिम में नहीं।

Do I आवश्यकता बाल्टी शर्तों?

आजकल अधिकांश स्लिम फाइलें पूरी तरह या लगभग 'पूर्ण' हैं, यानी कोई अंतराल नहीं है।
इसका मतलब है कि -बी विकल्प ध्यान देने योग्य भिन्न परिणाम नहीं देगा। उदाहरण के लिए,
आप एक बकेट टर्म OTHER-बाइंडिंग देख सकते हैं, जिसमें कुछ भी एनोटेट नहीं किया गया है: क्योंकि सभी
GO में बाइंडिंग के बच्चों को स्लिम फ़ाइल में दर्शाया गया है।

बकेट विकल्प वास्तव में केवल कुछ पुरानी संग्रहीत पतली फ़ाइलों के लिए आवश्यक है,
जो स्थिर हैं और काफी तदर्थ तरीके से उत्पन्न हुए थे; वे 'अंतराल' जमा करते हैं
समय के साथ (उदाहरण के लिए GO बाइंडिंग का एक नया बच्चा जोड़ देगा, लेकिन स्थिर स्लिम फ़ाइल तक नहीं होगी
दिनांक, इसलिए इस नए शब्द के लिए एनोटेट किया गया कोई भी जीन उत्पाद अन्य-बाध्यकारी में मैप करेगा
पतला)

ग्राफ बेमेल
ध्यान दें कि स्लिम ऑन्कोलॉजी फ़ाइल वर्तमान के संबंध में पुरानी हो सकती है
ऑन्कोलॉजी।

वर्तमान में map2slim स्लिम ग्राफ़ और ग्राफ़ के बीच ग्राफ़ बेमेल को फ़्लैग नहीं करता है
पूर्ण ऑन्कोलॉजी फ़ाइल; यह वास्तविक ग्राफ होने के रूप में पूर्ण ऑटोलॉजी लेता है। हालांकि
यदि आप चुनते हैं तो परिणामों को प्रारूपित करने के लिए स्लिम ऑन्कोलॉजी का उपयोग किया जाएगा -t -c विकल्प के रूप में।

आउटपुट
सामान्य मोड में, एक मानक प्रारूप जीन-एसोसिएशन फ़ाइल लिखी जाएगी। गो आईडी कॉलम
(5) गो स्लिम आईडी शामिल होंगे। मैपिंग तालिका के दूसरे कॉलम से मेल खाती है
ऊपर। ध्यान दें कि आउटपुट फ़ाइल में इनपुट फ़ाइल की तुलना में अधिक लाइनें हो सकती हैं। यह है
क्योंकि कुछ पूर्ण गो आईडी में एक से अधिक प्रासंगिक स्लिम आईडी होती हैं।

COUNT मोड

map2slim -c विकल्प के साथ चलाया जा सकता है, जो विशिष्ट जीन की गिनती देगा
प्रत्येक स्लिम टर्म के लिए मैप किए गए उत्पाद। कॉलम इस प्रकार हैं

गो टर्म
पहला कॉलम GO ID है जिसके बाद शब्द का नाम आता है (शब्द का नाम इस प्रकार दिया गया है
यह पूर्ण GO और स्लिम ऑन्कोलॉजी दोनों में पाया जाता है - ये आमतौर पर समान होंगे
लेकिन कभी-कभी स्लिम फाइल GO फाइल में बदलाव से पीछे रह जाती है)

जीन उत्पादों की संख्या जिसके लिए यह सबसे प्रासंगिक स्लिम टर्म है
विशिष्ट जीन उत्पादों की संख्या जिनके लिए यह सर्वाधिक प्रासंगिक/प्रत्यक्ष स्लिम है
पहचान। सबसे प्रत्यक्ष से हमारा तात्पर्य है कि या तो संघ सीधे इस शब्द से बना है,
या इस दुबले-पतले बच्चे से संबंध बनाया गया है और कोई पतला बच्चा नहीं है
वह शब्द जिसे एसोसिएशन मैप करता है।

अधिकांश दुबले-पतले लोगों के लिए, यह संख्या सीधे संघों की संख्या के बराबर होगी
इस स्लिम टर्म में मैप किया गया। हालाँकि, कुछ पुरानी पतली फ़ाइलें इसमें "धब्बेदार" होती हैं
"अंतराल" स्वीकार करें। उदाहरण के लिए, यदि स्लिम के पास "जैविक प्रक्रिया" के सभी बच्चे हैं
"व्यवहार" के अपवाद के बाद "व्यवहार" या उसके बच्चों के लिए सभी एनोटेशन होंगे
यहां गिना गया

नीचे उदाहरण देखें

स्लिम टर्म के साथ जुड़े होने का अनुमान लगाया गया जीन उत्पादों की संख्या
और विशिष्ट जीन उत्पादों की संख्या जो इसके किसी वंशज के लिए एनोटेट किए गए हैं
स्लिम आईडी (या स्लिम आईडी के लिए सीधे एनोटेट)।

अप्रचलित झंडा
जाओ ऑन्कोलॉजी

एक उदाहरण लेने के लिए; अगर हम इस तरह -t और -c का उपयोग करते हैं:

map2slim -t -c GO_slims/goslim_generic.obo ontology/gene_ontology.obo जीन-एसोसिएशंस/gene_association.fb

तब परिणाम का हिस्सा इस तरह दिख सकता है:

GO:0008150 जैविक_प्रक्रिया (जैविक_प्रक्रिया) 34 10025 जैविक_प्रक्रिया
GO:0007610 व्यवहार (व्यवहार) 632 632 जैविक_प्रक्रिया
GO: 0000004 जैविक प्रक्रिया अज्ञात (जैविक प्रक्रिया अज्ञात) 832 832 जैविक_प्रक्रिया
GO:0007154 सेल संचार (सेल संचार) 333 1701 जैविक_प्रक्रिया
GO:0008037 सेल रिकग्निशन (सेल रिकग्निशन) 19 19 बायोलॉजिकल_प्रोसेस
19 उत्पादों को GO: 0008037 या उसके किसी बच्चे के लिए मैप किया गया था। (GO:0008037 स्लिम में लीफ नोड है, इसलिए दोनों काउंट समान हैं)।

दूसरी ओर, GO:0008150 को केवल 34 उत्पाद मिलते हैं जिसके लिए यह सबसे अधिक प्रासंगिक है
अवधि। ऐसा इसलिए है क्योंकि अधिकांश एनोटेशन स्लिम में GO:0008150 के कुछ बच्चे के लिए मैप करेंगे,
जैसे GO:0007610 (व्यवहार)। इन 34 जीन उत्पादों को या तो सीधे तौर पर एनोटेट किया जाता है
GO:0008150, या इस शब्द के किसी बच्चे को जो स्लिम में नहीं है। यह इंगित कर सकता है
स्लिम में 'अंतराल'। ध्यान दें कि -b विकल्प के साथ map2slim चलाने से इन अंतरालों को 'प्लग' कर दिया जाएगा
कृत्रिम भराव शर्तों के साथ।

onworks.net सेवाओं का उपयोग करके ऑनलाइन map2slimp का उपयोग करें



नवीनतम Linux और Windows ऑनलाइन प्रोग्राम