स्पाइडी - क्लाउड में ऑनलाइन

यह कमांड स्पाइडी है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।

कार्यक्रम:

नाम


स्पाइडी - एमआरएनए अनुक्रमों को जीनोम में संरेखित करें

SYNOPSIS


स्पाइडी [-] [-F N] [-G] [-L N] [-M फ़ाइल का नाम] [-N फ़ाइल का नाम] [-R फ़ाइल का नाम] [-S पी/एम] [-T N]
[-X] [-a फ़ाइल का नाम] [-c N] [-d] [-e X] [-f X] [-g X] -i फ़ाइल का नाम [-j] [-k फ़ाइल का नाम] [-l N]
-m फ़ाइल का नाम [-n N] [-o str] [-p N] [-r सी/डी/एम/पी/वी] [-s] [-t फ़ाइल का नाम] [-u] [-w]

वर्णन


स्पाइडी किसी दिए गए जीनोमिक अनुक्रम में एक या अधिक एमआरएनए अनुक्रमों को संरेखित करने का एक उपकरण है।
स्पाइडी दो मुख्य लक्ष्यों को ध्यान में रखकर लिखा गया था: इंट्रोन की परवाह किए बिना अच्छे संरेखण ढूंढना
आकार; और आस-पास के स्यूडोजेन्स और पैरालॉग्स से भ्रमित होने से बचें। पहले की ओर
लक्ष्य, स्पाइडी इसे खोजने के लिए ब्लास्ट और डॉट व्यू (एक अन्य स्थानीय संरेखण उपकरण) का उपयोग करता है
संरेखण; चूँकि ये दोनों स्थानीय संरेखण उपकरण हैं, स्पाइडी आंतरिक रूप से नहीं है
छोटे या लंबे इंट्रॉन को प्राथमिकता दें और इसका कोई अधिकतम इंट्रॉन आकार नहीं है। गलती से बचने के लिए
पैरालॉग्स और स्यूडोजेनेस के एक्सॉन सहित, स्पाइडी सबसे पहले जीनोमिक पर विंडोज़ को परिभाषित करता है
अनुक्रम और फिर प्रत्येक विंडो के भीतर अलग से एमआरएनए-टू-जीनोमिक संरेखण निष्पादित करता है।
जिस तरह से खिड़कियों का निर्माण किया गया है, उसके कारण पड़ोसी पैरालॉग या स्यूडोजेन को ऐसा करना चाहिए
अलग-अलग विंडो में होना चाहिए और अंतिम स्प्लिस्ड संरेखण में शामिल नहीं किया जाना चाहिए।

प्रारंभिक संरेखण और निर्माण of जीनोमिक खिड़कियां
स्पाइडी इनपुट के रूप में एक एकल जीनोमिक अनुक्रम और एमआरएनए एक्सेसेशन या FASTA का एक सेट लेता है
क्रम. सभी प्रसंस्करण एक समय में एक एमआरएनए अनुक्रम से किया जाता है। प्रत्येक के लिए पहला कदम
एमआरएनए अनुक्रम जीनोमिक अनुक्रम के विरुद्ध एक उच्च कठोरता वाला ब्लास्ट है। परिणामी हिट
जीनोमिक विंडो खोजने के लिए विश्लेषण किया जाता है।

ब्लास्ट संरेखण को स्कोर के आधार पर क्रमबद्ध किया जाता है और फिर पुनरावर्ती द्वारा विंडोज़ में असाइन किया जाता है
फ़ंक्शन जो पहले संरेखण लेता है और फिर सभी को खोजने के लिए संरेखण सूची में नीचे जाता है
संरेखण जो पहले (एमआरएनए का एक ही स्ट्रैंड, एमआरएनए और दोनों) के अनुरूप हैं
जीनोमिक निर्देशांक गैर-अतिव्यापी और रैखिक रूप से सुसंगत हैं)। बाद के पासों पर,
शेष संरेखणों की जांच की जाती है और उन्हें अपने स्वयं के नॉनओवरलैपिंग में डाल दिया जाता है,
लगातार विंडो, जब तक कोई संरेखण नहीं छोड़ा जाता है। इस पर निर्भर करता है कि कितने जीन मॉडल हैं
वांछित, शीर्ष n अगले चरण पर जाने के लिए विंडोज़ को चुना जाता है और अन्य को
नष्ट कर दिया।

पंक्ति में करनेवाला in से प्रत्येक खिड़की
एक बार जब जीनोमिक विंडो का निर्माण हो जाता है, तो प्रारंभिक ब्लास्ट संरेखण मुक्त हो जाते हैं और
एक और ब्लास्ट खोज की जाती है, इस बार जीनोमिक के विरुद्ध संपूर्ण एमआरएनए के साथ
विंडो द्वारा परिभाषित क्षेत्र, और प्रारंभिक खोज की तुलना में कम कठोरता पर। स्पाइडी
फिर एक उच्च स्कोरिंग, नॉनओवरलैपिंग उपसमुच्चय उत्पन्न करने के लिए एक लालची एल्गोरिदम का उपयोग करता है
दूसरी ब्लास्ट खोज से संरेखण। इस सुसंगत सेट का सावधानीपूर्वक विश्लेषण किया जाता है
सुनिश्चित करें कि संपूर्ण एमआरएनए अनुक्रम संरेखण द्वारा कवर किया गया है। जब अंतराल पाए जाते हैं
संरेखण के बीच, जीनोमिक अनुक्रम के उपयुक्त क्षेत्र की खोज की जाती है
लापता एमआरएनए, पहले बहुत कम कठोरता वाले ब्लास्ट का उपयोग किया जाता है और, यदि ब्लास्ट खोजने में विफल रहता है
संरेखण का पता लगाने के लिए DotView फ़ंक्शंस का उपयोग करके हिट करें। जब के सिरों पर अंतराल पाए जाते हैं
संरेखण, BLAST और DotView खोजों को वास्तव में इससे आगे बढ़ने की अनुमति है
खिड़की की सीमाएँ. यदि एमआरएनए का 3' सिरा पूरी तरह से संरेखित नहीं होता है, तो यह है
सबसे पहले पॉली(ए) पूंछ की उपस्थिति की जांच की गई। को संरेखित करने का कोई प्रयास नहीं किया गया है
एमआरएनए का वह भाग जो एक पॉली(ए) टेल प्रतीत होता है; कभी-कभी एक पॉली(ए) पूँछ होती है
यह जीनोमिक अनुक्रम से संरेखित होता है, और इन्हें नोट किया जाता है क्योंकि वे संकेत देते हैं
स्यूडोजीन की संभावना.

अब जबकि एमआरएनए पूरी तरह से संरेखण के सेट, की सीमाओं से ढका हुआ है
संरेखण (अब प्रति एक्सॉन एक संरेखण होना चाहिए) को समायोजित किया जाता है ताकि
संरेखण एक-दूसरे से बिल्कुल सटे हुए हैं और इस प्रकार कि वे अच्छे ब्याह दाता के निकट हैं
और स्वीकर्ता साइटें। आमतौर पर, दो आसन्न एक्सॉन के संरेखण उतने ही ओवरलैप होते हैं
एमआरएनए अनुक्रम पर 20 या 30 आधार जोड़े। सच्ची एक्सॉन सीमा भीतर कहीं भी हो सकती है
यह ओवरलैप, या (जैसा कि हमने अनुभवजन्य रूप से देखा है) ओवरलैप के बाहर भी कुछ आधार जोड़े।
एक्सॉन सीमाओं की स्थिति के लिए, ओवरलैप प्लस प्रत्येक तरफ कुछ आधार जोड़े हैं
अलग-अलग स्प्लिस मैट्रिसेस वाले फ़ंक्शंस का उपयोग करके, स्प्लिस डोनर साइटों की जांच की गई
चुने गए जीव पर निर्भर करता है। तब शीर्ष कुछ ब्याह दाता साइटें (स्कोर के अनुसार) हैं
मूल्यांकन किया गया कि वे मूल संरेखण सीमाओं को कितना प्रभावित करते हैं। वह साइट
सीमाओं को सबसे कम प्रभावित करता है, और इसकी उपस्थिति के आधार पर मूल्यांकन किया जाता है
स्वीकर्ता साइट. संरेखण को आवश्यकतानुसार छोटा या विस्तारित किया जाता है ताकि वे
ब्याह दाता स्थल पर समाप्त करें और ताकि वे ओवरलैप न हों।

अंतिम परिणाम
प्रति एक्सॉन की प्रतिशत पहचान, संख्या प्राप्त करने के लिए खिड़कियों की सावधानीपूर्वक जांच की जाती है
प्रति एक्सॉन में अंतराल, समग्र प्रतिशत पहचान, एमआरएनए का प्रतिशत कवरेज, की उपस्थिति
एक संरेखित या गैर-संरेखित पॉली (ए) पूंछ, ब्याह दाता साइटों की संख्या और उपस्थिति या
प्रत्येक एक्सॉन के लिए ब्याह दाता और स्वीकर्ता साइटों की अनुपस्थिति, और एक एमआरएनए की घटना
जिसका सिरा 5' या 3' (या दोनों) है जो जीनोमिक अनुक्रम से संरेखित नहीं है। यदि
समग्र प्रतिशत पहचान और प्रतिशत लंबाई कवरेज उपयोगकर्ता-परिभाषित कटऑफ से ऊपर है, ए
सारांश रिपोर्ट मुद्रित की जाती है, और, यदि अनुरोध किया जाता है, तो पहचान दिखाने वाला एक पाठ संरेखण और
बेमेल भी मुद्रित है.

interspecies संरेखण
स्पाइडी अंतरजातीय संरेखण करने में सक्षम है। में प्रमुख अंतर
अंतरप्रजाति संरेखण यह है कि एमआरएनए-जीनोमिक पहचान 100% के करीब नहीं होगी
अंतःप्रजाति संरेखण में है; इसके अलावा, संरेखण में कई और लंबे अंतराल हैं। अगर
स्पाइडी अंतरप्रजातीय संरेखण करने के लिए इसके सामान्य मोड में उपयोग किया जाता है, यह जीन मॉडल तैयार करता है
कई, कई छोटे एक्सॉन के साथ। जब अंतरजातीय ध्वज सेट किया जाता है, स्पाइडी अलग-अलग उपयोग करता है
ब्लास्ट पैरामीटर लंबे और अधिक अंतराल को प्रोत्साहित करते हैं और इसके लिए भारी जुर्माना नहीं लगाते हैं
बेमेल इस तरह, एक्सॉन के लिए संरेखण अधिक लंबे और अधिक बारीकी से होते हैं
वास्तविक जीन संरचना का अनुमान लगाएं।

निकाला जा रहा है सीडीएस संरेखण
. स्पाइडी नेटवर्क-अवेयर मोड में चलाया जाता है या जब ASN.1 फ़ाइलों का उपयोग mRNA के लिए किया जाता है
रिकॉर्ड, यह एमआरएनए संरेखण से सीडीएस संरेखण निकालने और मुद्रण करने में सक्षम है
सीडीएस की जानकारी भी. चूँकि सीडीएस संरेखण एमआरएनए संरेखण का एक उपसमूह मात्र है,
आवश्यकतानुसार एक्सॉन संरेखण को छोटा करना अपेक्षाकृत सरल है
एक सीडीएस संरेखण उत्पन्न करें। इसके अलावा, अअनुवादित क्षेत्रों को अब परिभाषित किया गया है, इसलिए
5' और 3' अअनुवादित क्षेत्रों के लिए प्रतिशत पहचान की भी गणना की जाती है।

विकल्प


विकल्पों का सारांश नीचे दिया गया है।

- उपयोग संदेश प्रिंट करें।

-F N वांछित जीनोमिक अंतराल की शुरुआत (से; 0-आधारित)।

-G इनपुट फ़ाइल एक जीआई सूची है।

-L N उपयोग करने के लिए अतिरिक्त-बड़ा इंट्रॉन आकार (डिफ़ॉल्ट = 220000)।

-M फ़ाइल का नाम
डोनर स्प्लिस मैट्रिक्स के साथ फ़ाइल।

-N फ़ाइल का नाम
स्वीकर्ता ब्याह मैट्रिक्स के साथ फ़ाइल।

-R फ़ाइल का नाम
फ़िल्टरिंग के लिए ब्लास्ट डेटाबेस को दोहराने के लिए फ़ाइल (पथ सहित)।

-S पी/एम जीनोमिक अनुक्रम के प्लस (पी) या माइनस (एम) स्ट्रैंड तक सीमित रखें।

-T N वांछित जीनोमिक अंतराल को रोकना (को; 0-आधारित)।

-X अतिरिक्त-बड़े इंट्रॉन आकारों का उपयोग करें (प्रारंभिक और टर्मिनल इंट्रॉन के लिए सीमा बढ़ जाती है
100kb से 240kb तक और अन्य सभी के लिए 35kb से 120kb तक); परिणाम हो सकता है
गणना करने में काफी अधिक समय लगता है।

-a फ़ाइल का नाम
संरेखण के लिए आउटपुट फ़ाइल जब एक अलग फ़ाइल में निर्देशित की जाती है -p 3 (डिफ़ॉल्ट =
spidey.aln)।

-c N गुणवत्ता नियंत्रण प्रयोजनों के लिए पहचान कटऑफ, प्रतिशत में।

-d दिए गए एमआरएनए रिकॉर्ड के अनुरूप कोडिंग अनुक्रमों को संरेखित करने का भी प्रयास करें (हो सकता है)।
नेटवर्क एक्सेस की आवश्यकता है)।

-e X प्रथम-पास ई-वैल्यू (डिफ़ॉल्ट = 1.0e-10)। उच्च मूल्य लागत पर गति बढ़ाते हैं
संवेदनशीलता का.

-f X सेकेंड-पास ई-वैल्यू (डिफ़ॉल्ट = 0.001)।

-g X थर्ड-पास ई-वैल्यू (डिफ़ॉल्ट = 10)।

-i फ़ाइल का नाम
ASN.1 या FASTA प्रारूप में जीनोमिक अनुक्रम वाली इनपुट फ़ाइल। अपने अगर
कंप्यूटर ऐसे नेटवर्क पर चल रहा है जो जेनबैंक तक पहुंच सकता है, आप इसे प्रतिस्थापित कर सकते हैं
फ़ाइल नाम के लिए वांछित परिग्रहण संख्या.

-j ASN.1 संरेखण मुद्रित करें?

-k फ़ाइल का नाम
ASN.1 आउटपुट के लिए फ़ाइल -k (डिफ़ॉल्ट = स्पाइडी.एएसएन)।

-l N लंबाई कवरेज कटऑफ, प्रतिशत में।

-m फ़ाइल का नाम
ASN.1 या FASTA प्रारूप में mRNA अनुक्रम या सूची वाली इनपुट फ़ाइल
उनके परिग्रहण (के साथ) -G). यदि आपका कंप्यूटर किसी नेटवर्क पर चल रहा है तो ऐसा हो सकता है
जेनबैंक तक पहुंचें, आप फ़ाइल नाम के लिए एकल परिग्रहण संख्या को प्रतिस्थापित कर सकते हैं।

-n N प्रति इनपुट एमआरएनए लौटाने के लिए जीन मॉडल की संख्या (डिफ़ॉल्ट = 1)।

-o str मुख्य आउटपुट फ़ाइल (डिफ़ॉल्ट = stdout; द्वारा नियंत्रित सामग्री -p).

-p N प्रिंट संरेखण?
0 सारांश और संरेखण एक साथ (डिफ़ॉल्ट)
1 बस सारांश
2 बस संरेखण
3 विभिन्न फाइलों में सारांश और संरेखण

-r सी/डी/एम/पी/वी
जीनोमिक अनुक्रम का जीव, स्प्लिस मैट्रिस निर्धारित करने के लिए उपयोग किया जाता है।
c सी एलिगेंस
d ड्रोसोफिला
m डिक्टियोस्टेलियम डिसोइडम
p पौधा
v कशेरुक (डिफ़ॉल्ट)

-s अंतरप्रजाति संरेखण के लिए ट्यून करें।

-t फ़ाइल का नाम
फ़ीचर तालिका वाली फ़ाइल, 4 टैब-सीमांकित कॉलम में:
seqid (जैसे, एनएम_04377.1)
नाम (केवल दोहराव_क्षेत्र वर्तमान में समर्थित है)
प्रारंभ (0-आधारित)
रुकें (0-आधारित)

-u सभी इनपुट एमआरएनए का एक बहु संरेखण बनाएं (जो जीनोमिक पर ओवरलैप होना चाहिए
अनुक्रम)।

-w इनपुट FASTA अनुक्रमों में लोअरकेस वर्णों को छिपाने पर विचार करें।

onworks.net सेवाओं का उपयोग करके ऑनलाइन स्पाइडी का उपयोग करें



नवीनतम Linux और Windows ऑनलाइन प्रोग्राम