GoGPT Best VPN GoSearch

ऑनवर्क्स फ़ेविकॉन

सेमीस्कैन - क्लाउड में ऑनलाइन

उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर पर ऑनवर्क्स मुफ्त होस्टिंग प्रदाता में सेमीस्कैन चलाएं

यह कमांड सेमीस्कैन है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।

कार्यक्रम:

नाम


सेमीस्कैन - सहप्रसरण मॉडल डेटाबेस के विरुद्ध खोज अनुक्रम

SYNOPSIS


सेमीस्कैन [विकल्प]

वर्णन


सेमीस्कैन सहप्रसरण मॉडल के संग्रह के विरुद्ध अनुक्रम खोजने के लिए उपयोग किया जाता है। प्रत्येक के लिए
अनुक्रम में , सीएम के लक्ष्य डेटाबेस को खोजने के लिए उस क्वेरी अनुक्रम का उपयोग करें
, और सबसे महत्वपूर्ण मिलान वाले सीएम की आउटपुट रैंक वाली सूचियां
अनुक्रम।

RSI एक से अधिक क्वेरी अनुक्रम हो सकते हैं। यह FASTA प्रारूप में हो सकता है, या
कई अन्य सामान्य अनुक्रम फ़ाइल प्रारूप (जेनबैंक, ईबीएल, और अन्य के बीच), या में
संरेखण फ़ाइल स्वरूप (स्टॉकहोम, संरेखित फास्टा, और अन्य)। देखें --qformat विकल्प
पूरी सूची के लिए।

RSI का उपयोग करके प्रेस करने की आवश्यकता है सेमीप्रेस इसके साथ खोजा जा सकता है सेमीस्कैन। इस
.i1{fimp} प्रत्यय लगाकर चार बाइनरी फ़ाइलें बनाता है। इसके अतिरिक्त, रहा होगा
ई-वैल्यू के लिए कैलिब्रेटेड सेमीकैलिब्रेट दबाए जाने से पहले सीएमप्रेस.

पूछताछ हो सकता है '-' (एक डैश कैरेक्टर), जिस स्थिति में क्वेरी अनुक्रम हैं
a . से पढ़ें फ़ाइल के बजाय पाइप। NS a से पढ़ा नहीं जा सकता
स्ट्रीम, क्योंकि इसके लिए उन चार सहायक बाइनरी फ़ाइलों की आवश्यकता होती है जो उत्पन्न होती हैं सीएमप्रेस.

आउटपुट स्वरूप मानव-पठनीय होने के लिए डिज़ाइन किया गया है, लेकिन अक्सर इतना बड़ा होता है कि
इसे पढ़ना अव्यावहारिक है, और इसे पार्स करना एक दर्द है। NS --tbloout विकल्प आउटपुट को a . में बचाता है
सरल सारणीबद्ध प्रारूप जो संक्षिप्त और पार्स करने में आसान है। NS -o विकल्प अनुमति देता है
मुख्य आउटपुट को पुनर्निर्देशित करना, जिसमें इसे /dev/null में फेंकना शामिल है।

सेमीस्कैन विशेष एल्गोरिदम का उपयोग करके लक्ष्य अनुक्रमों के 5' और 3' टर्मिनी की पुन: जांच करता है
का पता लगाने के लिए छोटा कर दिया हिट, वास्तविक पूर्ण . के 5' और/या 3' छोर के किस भाग में
लक्ष्य अनुक्रम फ़ाइल में लम्बाई समरूप अनुक्रम अनुपलब्ध है। इस प्रकार के हिट
अनुक्रम फ़ाइलों में सबसे आम होगा जिसमें असंबद्ध अनुक्रमण पढ़ता है। द्वारा
डिफ़ॉल्ट, लक्ष्य के पहले अवशेष को शामिल करने के लिए किसी भी 5' काटे गए हिट की आवश्यकता होती है
अनुक्रम यह in . से प्राप्त होता है , और किसी भी 3' काटे गए हिट को शामिल करने के लिए आवश्यक है
लक्ष्य अनुक्रम का अंतिम अवशेष जो इसे प्राप्त करता है। कोई भी 5' और 3' काटे गए हिट अवश्य
लक्ष्य अनुक्रम का पहला और अंतिम अवशेष शामिल करें जिससे यह प्राप्त होता है। NS --anytrunc
विकल्प अनुक्रम समापन बिंदुओं के हिट समावेशन के लिए आवश्यकताओं में ढील देगा, और छोटा कर दिया जाएगा
हिट को लक्ष्य अनुक्रम के किसी भी स्थान पर शुरू और बंद करने की अनुमति है। महत्वपूर्ण बात
हालांकि, साथ --एनीट्रंक, हिट ई-मान कम सटीक होंगे क्योंकि मॉडल अंशांकन करता है
काटे गए हिट की संभावना पर विचार न करें, इसलिए सावधानी के साथ इसका इस्तेमाल करें। NS --नोट्रंक
काटे गए हिट डिटेक्शन को बंद करने के लिए विकल्प का उपयोग किया जा सकता है। --नोट्रंक दौड़ना कम करेगा
का समय सेमीस्कैन, लक्ष्य के लिए सबसे महत्वपूर्ण फ़ाइलें जिनमें कई छोटे शामिल हैं
क्रम. जब ट्रंकेटेड हिट डिटेक्शन स्वचालित रूप से बंद हो जाता है --मैक्स, --नोह्म,
--क्यूडीबी, or -- बिना बंधी विकल्पों का उपयोग किया जाता है क्योंकि यह त्वरित एचएमएम के उपयोग पर निर्भर करता है
बैंडेड संरेखण रणनीति जो उनमें से किसी भी विकल्प द्वारा बंद कर दी गई है।

विकल्प


-h मदद; कमांड लाइन उपयोग और सभी उपलब्ध विकल्पों का एक संक्षिप्त अनुस्मारक प्रिंट करें।

-g चालू करो ग्लोकल संरेखण एल्गोरिथ्म, क्वेरी मॉडल के संबंध में वैश्विक और
लक्ष्य डेटाबेस के संबंध में स्थानीय। डिफ़ॉल्ट रूप से, स्थानीय संरेखण
एल्गोरिदम का उपयोग किया जाता है जो लक्ष्य अनुक्रम और दोनों के संबंध में स्थानीय है
आदर्श। स्थानीय मोड में, यदि आवश्यक हो तो संरेखण को दो या दो से अधिक बाद में फैलाना चाहिए
(उदाहरण के लिए यदि क्वेरी मॉडल और लक्ष्य अनुक्रम की संरचनाएं केवल आंशिक रूप से हैं
साझा), संरचना में कुछ बड़े सम्मिलन और विलोपन की अनुमति देता है
सामान्य इंडेल्स की तुलना में अलग तरह से दंडित किया गया। स्थानीय मोड अनुभवजन्य पर बेहतर प्रदर्शन करता है
बेंचमार्क और रिमोट होमोलॉजी डिटेक्शन के लिए काफी अधिक संवेदनशील है।
आनुभविक रूप से, ग्लोकल खोजें स्थानीय खोजों की तुलना में बहुत कम हिट लौटाती हैं, इसलिए ग्लोकल
कुछ अनुप्रयोगों के लिए वांछित हो सकता है।

-Z ई-मानों की गणना करें जैसे कि खोज स्थान का आकार था डेटाबेस (एमबी)। के बिना
इस विकल्प के उपयोग से, प्रत्येक क्वेरी अनुक्रम के लिए खोज स्थान का आकार बदल जाता है
वर्तमान क्वेरी अनुक्रम की लंबाई को 2 गुना के रूप में परिभाषित किया गया है (क्योंकि दोनों स्ट्रैंड
अनुक्रम की खोज की जाएगी) सीएम की संख्या से गुना .

--देवसहायता
प्रिंट सहायता, साथ में -h , लेकिन इसमें विशेषज्ञ विकल्प भी शामिल हैं जो प्रदर्शित नहीं होते हैं
साथ में -h . इन विशेषज्ञ विकल्पों के विशाल के लिए प्रासंगिक होने की उम्मीद नहीं है
अधिकांश उपयोगकर्ता और इसलिए मैनुअल पेज में वर्णित नहीं हैं। एकमात्र संसाधन
यह समझने के लिए कि वे वास्तव में क्या करते हैं संक्षिप्त एक-पंक्ति विवरण आउटपुट हैं
कब --देवसहायता सक्षम है, और स्रोत कोड।

विकल्प के लिए नियंत्रित आउटपुट


-o मुख्य मानव-पठनीय आउटपुट को फ़ाइल में निर्देशित करें डिफ़ॉल्ट स्टडआउट के बजाय।

--tbloout
एक के साथ मिली हिट को सारांशित करते हुए एक साधारण सारणीबद्ध (स्पेस-सीमांकित) फ़ाइल सहेजें
प्रति हिट डेटा लाइन. इस फ़ाइल का प्रारूप इनफर्नल उपयोगकर्ता में वर्णित है
मार्गदर्शक।

--एसीसी मुख्य आउटपुट में नामों के बजाय एक्सेस का उपयोग करें, जहां प्रोफाइल के लिए उपलब्ध हो
और/या अनुक्रम।

--नोअली
मुख्य आउटपुट से संरेखण अनुभाग को छोड़ दें। यह आउटपुट को बहुत कम कर सकता है
मात्रा।

--notextw
मुख्य आउटपुट में प्रत्येक पंक्ति की लंबाई को सीमित करें। डिफ़ॉल्ट 120 . की सीमा है
प्रति पंक्ति वर्ण, जो टर्मिनलों पर आउटपुट को स्पष्ट रूप से प्रदर्शित करने में मदद करता है और
संपादकों में, लेकिन लक्ष्य प्रोफ़ाइल विवरण पंक्तियों को छोटा कर सकता है।

--textw
मुख्य आउटपुट की लाइन लंबाई सीमा को सेट करें प्रति पंक्ति वर्ण। डिफ़ॉल्ट है
120.

--शब्दशः
फ़िल्टर सहित मुख्य आउटपुट में अतिरिक्त खोज पाइपलाइन आँकड़े शामिल करें
काटे गए हिट का पता लगाने और छोड़े गए लिफाफों की संख्या के लिए जीवित रहने के आंकड़े
मैट्रिक्स आकार अतिप्रवाह के कारण।

विकल्प नियंत्रित रिपोर्टिंग थ्रेसहोल्ड


रिपोर्टिंग थ्रेशोल्ड नियंत्रित करता है कि कौन से हिट आउटपुट फाइलों में रिपोर्ट किए जाते हैं (मुख्य आउटपुट और
--टब्लाउट) हिट्स को सांख्यिकीय महत्व (ई-वैल्यू) के आधार पर रैंक किया जाता है। डिफ़ॉल्ट रूप से, सभी हिट
ई-मान <= 10 के साथ सूचित किया जाता है। निम्नलिखित विकल्प आपको डिफ़ॉल्ट बदलने की अनुमति देते हैं
ई-मूल्य रिपोर्टिंग थ्रेसहोल्ड, या इसके बजाय बिट स्कोर थ्रेसहोल्ड का उपयोग करने के लिए।

-E प्रति-लक्ष्य आउटपुट में, <= . के ई-मान के साथ लक्ष्य अनुक्रमों की रिपोर्ट करें . RSI
डिफ़ॉल्ट 10.0 है, जिसका अर्थ है कि औसतन लगभग 10 झूठी सकारात्मक रिपोर्ट की जाएगी
प्रति प्रश्न, ताकि आप शोर के शीर्ष को देख सकें और अपने लिए तय कर सकें कि क्या यह है
वास्तव में शोर।

-T ई-मान पर प्रति-सीएम आउटपुट थ्रेशोल्ड करने के बजाय, लक्ष्य अनुक्रमों की रिपोर्ट करें a
बिट स्कोर>= .

विकल्प के लिए समावेशन थ्रेसहोल्ड


समावेशन थ्रेशोल्ड रिपोर्टिंग थ्रेशोल्ड की तुलना में अधिक सख्त हैं। समावेशन सीमा नियंत्रण
किन हिट्स को संभावित बाद में शामिल करने के लिए पर्याप्त विश्वसनीय माना जाता है
खोज दौर, या हिट में संदिग्ध ("?") के विपरीत महत्वपूर्ण ("!") के रूप में चिह्नित किया गया
उत्पादन.

--incई
<= . के ई-मान का उपयोग करें हिट समावेशन सीमा के रूप में। डिफ़ॉल्ट 0.01 है,
इसका मतलब है कि औसतन, प्रत्येक 1 . में लगभग 100 झूठी सकारात्मक की उम्मीद की जाएगी
विभिन्न क्वेरी अनुक्रमों के साथ खोज करता है।

--incT
समावेशन सीमा निर्धारित करने के लिए ई-मानों का उपयोग करने के बजाय, थोड़ा सा उपयोग करें
>= . का स्कोर हिट समावेशन सीमा के रूप में। डिफ़ॉल्ट रूप से यह विकल्प सेट नहीं है।

विकल्प के लिए मॉडल-विशिष्ट स्कोर थ्रेशोल्डिंग


क्यूरेटेड सीएम डेटाबेस प्रत्येक सीएम के लिए विशिष्ट बिट स्कोर थ्रेसहोल्ड को परिभाषित कर सकते हैं, किसी को भी हटा सकते हैं
अकेले सांख्यिकीय महत्व के आधार पर थ्रेसहोल्डिंग।

इन विकल्पों का उपयोग करने के लिए, प्रोफ़ाइल में उपयुक्त (GA, TC, और/या NC) होना चाहिए
वैकल्पिक स्कोर थ्रेशोल्ड एनोटेशन; यह द्वारा उठाया जाता है सेमीबिल्ड स्टॉकहोम प्रारूप से
संरेखण फ़ाइलें। प्रत्येक थ्रेशोल्डिंग विकल्प का स्कोर है बिट्स, और कार्य करता है जैसे कि -T
--incT प्रत्येक मॉडल के क्यूरेटेड थ्रेसहोल्ड का उपयोग करके विशेष रूप से लागू किया गया है।

--कट_गा
हिट रिपोर्टिंग और समावेशन सेट करने के लिए मॉडल में GA (एकत्रित) बिट स्कोर का उपयोग करें
दहलीज। GA थ्रेशोल्ड को आम तौर पर विश्वसनीय क्यूरेटेड माना जाता है
पारिवारिक सदस्यता को परिभाषित करने वाली दहलीज; उदाहरण के लिए, Rfam में, ये सीमाएँ
परिभाषित करें कि Rfam में क्या शामिल है Rfam Seed के साथ खोजों के आधार पर पूर्ण संरेखण
मॉडल ।

--कट_एनसी
हिट रिपोर्टिंग सेट करने के लिए मॉडल में NC (शोर कटऑफ) बिट स्कोर थ्रेसहोल्ड का उपयोग करें
और समावेशन की दहलीज। एनसी थ्रेसहोल्ड को आम तौर पर का स्कोर माना जाता है
उच्चतम स्कोरिंग ज्ञात झूठी सकारात्मक।

--कट_टीसी
हिट रिपोर्टिंग सेट करने के लिए मॉडल में टीसी (विश्वसनीय कटऑफ) बिट स्कोर थ्रेसहोल्ड का उपयोग करें
और समावेशन की दहलीज। टीसी थ्रेशोल्ड को आम तौर पर का स्कोर माना जाता है
सबसे कम स्कोरिंग ज्ञात सच्ची सकारात्मक जो सभी ज्ञात झूठी सकारात्मक से ऊपर है।

विकल्प नियंत्रित THE त्वरण पाइप लाइन


राक्षसी 1.1 खोजों को छह-चरण फ़िल्टर पाइपलाइन में त्वरित किया जाता है। पहले पांच
चरण छह सीएम CYK . को पास किए गए लिफाफों को परिभाषित करने के लिए चरण एक प्रोफ़ाइल HMM का उपयोग करते हैं
छानना। कोई भी लिफाफा जो सभी फिल्टरों से बचे रहते हैं, उन्हें CM . का उपयोग करके अंतिम अंक दिए जाते हैं
एल्गोरिदम के अंदर.

प्रोफ़ाइल HMM फ़िल्टर किसके द्वारा बनाया गया है सेमीबिल्ड प्रोग्राम और में स्टोर किया जाता है .

प्रत्येक क्रमिक फ़िल्टर पिछले वाले की तुलना में धीमा है, लेकिन इससे बेहतर है
उच्च-स्कोरिंग वाले सीएम हिट और ऐसा करने वाले अनुक्रमों के बीच अंतर करना
नहीं। पहले तीन HMM फ़िल्टर चरण HMMER3 में उपयोग किए गए चरणों के समान हैं। चरण 1 (F1)
स्थानीय HMM SSV फ़िल्टर लंबे अनुक्रमों के लिए संशोधित किया गया है। स्टेज 2 (F2) स्थानीय HMM है
विटरबी फिल्टर। स्टेज 3 (F3) स्थानीय HMM फॉरवर्ड फिल्टर है। पहले तीन में से प्रत्येक
चरण स्थानीय मोड में प्रोफ़ाइल HMM का उपयोग करते हैं, जो लक्ष्य अनुवर्ती को . के साथ संरेखित करने की अनुमति देता है
एचएमएम का कोई भी क्षेत्र। स्टेज 4 (F4) एक ग्लोकल HMM फ़िल्टर है, जिसके लिए लक्ष्य की आवश्यकता होती है
पूर्ण-लंबाई प्रोफ़ाइल HMM में संरेखित करने के बाद। स्टेज 5 (F5) ग्लोकल HMM है
लिफाफा परिभाषा फ़िल्टर, जो परिभाषित करने के लिए HMMER3 के डोमेन पहचान हेरसिटिक्स का उपयोग करता है
लिफाफा सीमाएं। 2 से 5 तक प्रत्येक चरण के बाद एक पूर्वाग्रह फ़िल्टर चरण (F2b, F3b, F4b, and .)
F5b) का उपयोग उन अनुक्रमों को हटाने के लिए किया जाता है जो पक्षपाती होने के कारण फ़िल्टर से गुजरते हुए प्रतीत होते हैं
अकेले रचना। कोई भी लिफाफा जो F1 से F5b तक के चरणों में जीवित रहता है, उसके साथ पारित किया जाता है
स्थानीय सीएम CYK फ़िल्टर। CYK फ़िल्टर HMM से प्राप्त बाधाओं (बैंड) का उपयोग करता है
आवश्यक गणनाओं की संख्या को कम करने और समय बचाने के लिए लिफाफे का संरेखण।
सीवाईके पास करने वाले किसी भी लिफाफे को स्थानीय सीएम इनसाइड एल्गोरिदम के साथ फिर से एचएमएम का उपयोग करके स्कोर किया जाता है
त्वरण के लिए बैंड।

डिफ़ॉल्ट फ़िल्टर थ्रेशोल्ड जो बाद के लिए आवश्यक न्यूनतम स्कोर को परिभाषित करता है
प्रत्येक चरण में जीवित रहने को खोज स्थान (Z) के आकार के आधार पर परिभाषित किया गया है, जिसे परिभाषित किया गया है
वर्तमान क्वेरी अनुक्रम की लंबाई 2 गुना है (क्योंकि दोनों स्ट्रैंड होंगे
खोजा गया) प्रोफ़ाइल की संख्या का गुना . हालाँकि, यदि या तो -Z or --एफजेड
विकल्पों का उपयोग किया जाता है तो खोज स्थान माना जाएगा के प्रयोजनों के लिए
फ़िल्टर थ्रेसहोल्ड को परिभाषित करना।

बड़े डेटाबेस के लिए, फ़िल्टर अधिक सख्त होते हैं जिससे अधिक त्वरण होता है
संभावित रूप से संवेदनशीलता का अधिक नुकसान। तर्क यह है कि बड़े डेटाबेस के लिए,
सांख्यिकीय महत्व प्राप्त करने के लिए हिट के उच्च अंक होने चाहिए, इसलिए फ़िल्टरिंग सख्त होनी चाहिए
जो कम स्कोरिंग महत्वहीन हिट को हटा देता है वह स्वीकार्य है।

सभी संभावित खोज स्थान आकारों और सभी फ़िल्टर चरणों के लिए P-मान थ्रेशोल्ड हैं
आगे सूचीबद्ध। (0.01 की पी-वैल्यू थ्रेशोल्ड का मतलब है कि उच्चतम स्कोरिंग का लगभग 1%)
गैर-समरूप अनुवर्ती से फ़िल्टर पास होने की उम्मीद है।) Z को की संख्या के रूप में परिभाषित किया गया है
पूरे लक्ष्य अनुक्रम में न्यूक्लियोटाइड्स 2 बार फ़ाइल करते हैं क्योंकि दोनों स्ट्रैंड होंगे
प्रत्येक मॉडल के साथ खोजा गया।

यदि Z 2 एमबी से कम है: F1 0.35 है; F2 और F2b बंद हैं; F3, F3b, F4, F4b और F5 0.02 हैं;
F6 0.0001 है।

अगर Z 2 एमबी और 20 एमबी के बीच है: एफ 1 0.35 है; F2 और F2b बंद हैं; F3, F3b, F4, F4b और F5
0.005 हैं; F6 0.0001 है।

अगर Z 20 एमबी और 200 एमबी के बीच है: एफ 1 0.35 है; F2 और F2b 0.15 हैं; F3, F3b, F4, F4b और F5
0.003 हैं; F6 0.0001 है।

यदि Z 200 एमबी और 2 जीबी के बीच है: एफ1 0.15 है; F2 और F2b 0.15 हैं; F3, F3b, F4, F4b, F5,
और F5b 0.0008 हैं; और F6 0.0001 है।

यदि Z 2 Gb और 20 Gb के बीच है: F1 0.15 है; F2 और F2b 0.15 हैं; F3, F3b, F4, F4b, F5, और
F5b 0.0002 हैं; और F6 0.0001 है।

यदि Z 20 Gb से अधिक है: F1 0.06 है; F2 और F2b 0.02 हैं; F3, F3b, F4, F4b, F5, और F5b
0.0002 हैं; और F6 0.0001 है।

इन थ्रेसहोल्ड को कई आंतरिक बेंचमार्क परीक्षण पर प्रदर्शन के आधार पर चुना गया था
विभिन्न संभावित सेटिंग्स।

सामान्य फ़िल्टरिंग स्तर को नियंत्रित करने के लिए पाँच विकल्प हैं। ये विकल्प हैं, in
कम से कम सख्त (सबसे धीमी लेकिन सबसे संवेदनशील) से सबसे सख्त (सबसे तेज लेकिन सबसे कम)
संवेदनशील): --मैक्स, --नोह्म, --मध्य, --चूक जाना, (यह डिफ़ॉल्ट सेटिंग है) --आरएफएम. और
--हमोनली। - --चूक जाना फ़िल्टर थ्रेसहोल्ड डेटाबेस-आकार पर निर्भर होंगे। देखें
अधिक जानकारी के लिए नीचे दिए गए इन व्यक्तिगत विकल्पों में से प्रत्येक की व्याख्या।

इसके अतिरिक्त, एक विशेषज्ञ उपयोगकर्ता प्रत्येक फ़िल्टर चरण स्कोर सीमा को सटीक रूप से नियंत्रित कर सकता है
la --F1, --F1b, --F2, --F2b, --F3, --F3b, --F4, --F4b, --F5, --F5b, और --F6 विकल्प। जैसा
साथ ही प्रत्येक चरण को चालू या बंद करें --noF1, --doF1b, --noF2, --noF2b, --noF3,
--noF3b, --noF4, --noF4b, --noF5, और --नहींF6. विकल्प। ये विकल्प केवल प्रदर्शित होते हैं
अगर --देवसहायता विकल्प का उपयोग प्रदर्शित विकल्पों की संख्या को रखने के लिए किया जाता है -h
उचित, और क्योंकि उनसे केवल उपयोगकर्ताओं के एक छोटे से अल्पसंख्यक के लिए उपयोगी होने की उम्मीद की जाती है।

एक विशेष मामले के रूप में, में किसी भी मॉडल के लिए जिसमें शून्य बेसपेयर हैं, प्रोफ़ाइल HMM
सीएम की तलाश की जगह सर्च अभियान चलाया जा रहा है। एचएमएम एल्गोरिदम सीएम की तुलना में अधिक कुशल हैं
एल्गोरिदम, और सीएम एल्गोरिदम का लाभ बिना किसी माध्यमिक वाले मॉडल के लिए खो जाता है
संरचना (शून्य बेसपेयर)। ये प्रोफ़ाइल HMM खोजें . की तुलना में काफ़ी तेज़ी से चलेंगी
सीएम तलाशी ले रहे हैं। आप HMM-केवल खोजों को इसके साथ बाध्य कर सकते हैं --हमोनली विकल्प। अधिक जानकारी के लिए
केवल एचएमएम खोजों पर जानकारी के लिए उपयोगकर्ता मार्गदर्शिका देखें।

--मैक्स सभी फ़िल्टर बंद करें, और प्रत्येक पूर्ण-लंबाई वाले लक्ष्य पर गैर-बैंडेड इनसाइड चलाएं
अनुक्रम। यह संवेदनशीलता को कुछ हद तक बढ़ाता है, गति में बहुत बड़ी लागत पर।

--नोहम्म
सभी HMM फ़िल्टर चरणों को बंद करें (F1 से F5b तक)। QDBs का उपयोग करते हुए CYK फ़िल्टर, होगा
प्रत्येक पूर्ण-लंबाई लक्ष्य अनुक्रम पर चलाया जाएगा और P-मान की सीमा को लागू करेगा
0.0001. CYK से बचे प्रत्येक बाद को इनसाइड में पास किया जाएगा, जो
QDBs (लेकिन एक शिथिल सेट) का भी उपयोग करें। इससे संवेदनशीलता कुछ हद तक बढ़ जाती है
गति में बड़ी लागत।

--मिडी HMM SSV और Viterbi फ़िल्टर चरणों (F1 से F2b) को बंद करें। शेष एचएमएम सेट करें
फ़िल्टर थ्रेशोल्ड (F3 से F5b तक) डिफ़ॉल्ट रूप से 0.02 तक, लेकिन बदलने योग्य साथ में
--फमिडी अनुक्रम। यह गति में महत्वपूर्ण लागत पर संवेदनशीलता बढ़ा सकता है।

--चूक जाना
डिफ़ॉल्ट फ़िल्टरिंग रणनीति का उपयोग करें। यह विकल्प डिफ़ॉल्ट रूप से चालू है। फिल्टर
थ्रेसहोल्ड डेटाबेस आकार के आधार पर निर्धारित किए जाते हैं।

--rfam बड़े डेटाबेस (20 Gb से अधिक) के लिए तैयार की गई एक सख्त फ़िल्टरिंग रणनीति का उपयोग करें। इस
संवेदनशीलता की संभावित कीमत पर खोज में तेजी लाएगा।

--हमोनली
खोजों के लिए केवल फ़िल्टर प्रोफ़ाइल HMM का उपयोग करें, CM का उपयोग न करें। केवल फ़िल्टर
चरणों F1 से F3 को सख्त P-मान थ्रेशोल्ड (0.02 for .) का उपयोग करके निष्पादित किया जाएगा
F1, 0.001 F2 के लिए और 0.00001 F3 के लिए)। इसके अतिरिक्त एक पूर्वाग्रह संरचना फ़िल्टर है
F1 चरण ( P = 0.02 उत्तरजीविता सीमा के साथ) के बाद उपयोग किया जाता है। कोई भी हिट जो बच जाती है
सभी चरणों और रिपोर्टिंग सीमा से ऊपर एक एचएमएम ई-मूल्य या बिट स्कोर होगा
आउटपुट हो। उपयोगकर्ता एचएमएम-केवल फ़िल्टर थ्रेसहोल्ड और विकल्पों को बदल सकता है
--हम्मएफ1, --हम्मएफ2, --हम्मएफ3, --हम्मनोबियास, --हम्मनोनल2, और --हम्ममैक्स। डिफ़ॉल्ट रूप से,
शून्य बेसपेयर वाले किसी भी मॉडल की खोज केवल HMM-मोड में चलाई जाएगी। यह हो सकता है
बंद किया जा सकता है, सीएम को इन मॉडलों के लिए खोज करने के लिए मजबूर किया जा रहा है --नोहमोनली विकल्प.

--एफजेड
यदि डेटाबेस थे तो फ़िल्टर थ्रेशोल्ड को डिफ़ॉल्ट के रूप में सेट करें डेटाबेस (एमबी)।
यदि के साथ प्रयोग किया जाता है 20000 (20 Gb) से अधिक इस विकल्प का वही प्रभाव है जो
--आरएफएम.

--फमिडी
उसके साथ --मिडी विकल्प HMM फ़िल्टर थ्रेशोल्ड (F3 से F5b तक) को . पर सेट करें . By
चूक, एक्सएनएनएक्स है।

अन्य विकल्प


--नोट्रंक
काटे गए हिट डिटेक्शन को बंद करें।

--anytrunc
काटे गए हिट को लक्ष्य अनुक्रम में किसी भी स्थान पर प्रारंभ और समाप्त होने दें। द्वारा
डिफ़ॉल्ट रूप से, 5' काटे गए हिट में उनके लक्ष्य अनुक्रम का पहला अवशेष शामिल होना चाहिए
और 3' काट-छांट किए गए हिट में उनके लक्षित अनुक्रम के अंतिम अवशेष शामिल होने चाहिए। साथ में
यह विकल्प आप कम पूर्ण लंबाई वाले हिट देख सकते हैं जो शुरुआत तक विस्तारित होते हैं और
प्रश्न का अंत सीएम।

--नॉनुल3
पक्षपाती रचना के लिए नल3 सीएम स्कोर सुधार बंद करें। यह सुधार है
HMM फ़िल्टर चरणों के दौरान उपयोग नहीं किया जाता है।

--mxsize
अधिकतम स्वीकार्य सीएम डीपी मैट्रिक्स आकार सेट करें मेगाबाइट। डिफ़ॉल्ट रूप से यह आकार
128 एमबी है। यह अधिकांश खोजों के लिए काफ़ी बड़ा होना चाहिए,
विशेष रूप से छोटे मॉडल के साथ। अगर सेमीसर्च CYK में एक लिफाफा मिलता है or
अंदर के चरण में एक बड़े मैट्रिक्स की आवश्यकता होती है, लिफाफा से छूट दी जाएगी
सोच - विचार। यह व्यवहार एक अतिरिक्त फ़िल्टर की तरह है जो महंगा होने से रोकता है
(धीमी) सीएम डीपी गणना, लेकिन संवेदनशीलता की संभावित कीमत पर। ध्यान दें कि अगर
सेमीसर्च में चलाया जा रहा है एक मल्टीकोर मशीन पर एकाधिक धागे तो प्रत्येक
थ्रेड में आकार तक का आबंटित मैट्रिक्स हो सकता है किसी भी समय एमबी।

--smxsize
अधिकतम स्वीकार्य सीएम खोज डीपी मैट्रिक्स आकार को सेट करें मेगाबाइट। डिफ़ॉल्ट रूप से
यह आकार 128 एमबी है। यह विकल्प केवल तभी प्रासंगिक है जब मुख्यमंत्री एचएमएम का उपयोग नहीं करेंगे
बैंडेड मैट्रिसेस, अर्थात यदि --मैक्स, --नोह्म, --क्यूडीबी, --fqdb, -- बिना बंधी, or
--fnonbanded विकल्पों का भी उपयोग किया जाता है। ध्यान दें कि अगर सेमीसर्च में चलाया जा रहा है
एक मल्टीकोर मशीन पर एकाधिक थ्रेड तो प्रत्येक थ्रेड में आवंटित हो सकता है
आकार तक का मैट्रिक्स किसी भी समय एमबी।

--साइको सभी हिट का अंतिम स्कोर निर्धारित करने के लिए, अंदर नहीं, CYK एल्गोरिथम का उपयोग करें।

--एसीको हिट संरेखित करने के लिए CYK एल्गोरिथम का उपयोग करें। डिफ़ॉल्ट रूप से, डर्बिन/होम्स इष्टतम सटीकता
एल्गोरिथ्म का उपयोग किया जाता है, जो उस संरेखण को ढूंढता है जो अपेक्षित सटीकता को अधिकतम करता है
सभी गठबंधन अवशेषों की।

--wcx
प्रत्येक सीएम के लिए, डब्ल्यू पैरामीटर, हिट की अपेक्षित अधिकतम लंबाई, पर सेट करें
मॉडल की सर्वसम्मति की लंबाई का गुना। डिफ़ॉल्ट रूप से, W पैरामीटर से पढ़ा जाता है
सीएम फ़ाइल और मॉडल की संक्रमण संभावनाओं के आधार पर गणना की गई थी
by सेमीबिल्ड आप पता लगा सकते हैं कि मॉडल का उपयोग करने के लिए डिफ़ॉल्ट W क्या है सेमीस्टैट। इस
विकल्प का उपयोग सावधानी के साथ किया जाना चाहिए क्योंकि यह फ़िल्टरिंग पाइपलाइन को कई बार प्रभावित करता है
गैर-स्पष्ट तरीकों से विभिन्न चरणों। यह केवल विशेषज्ञ उपयोगकर्ताओं के लिए अनुशंसित है
उन हिट्स की खोज करना जो निर्माण के लिए उपयोग किए जाने वाले किसी भी होमोलॉग की तुलना में अधिक लंबी हों
में मॉडल सेमीबिल्ड, उदाहरण के लिए बड़े इंट्रॉन या अन्य बड़े सम्मिलन वाले। यह
के साथ संयोजन में उपयोग नहीं किया जा सकता --नोह्म, --fqdb or --qdb विकल्प क्योंकि में
वे मामले W क्वेरी-निर्भर बैंड द्वारा सीमित हैं।

--केवल शीर्ष
लक्ष्य अनुक्रमों के केवल शीर्ष (वाटसन) स्ट्रैंड को खोजें . डिफ़ॉल्ट रूप से,
दोनों धागों की खोज की जाती है। इससे खोज स्थान का आकार (Z) आधा हो जाएगा।

--सिर्फ नीचे
लक्ष्य अनुक्रमों के केवल निचले (क्रिक) स्ट्रैंड को खोजें . By
डिफ़ॉल्ट, दोनों स्ट्रैंड खोजे जाते हैं। इससे खोज स्थान का आकार (Z) आधा हो जाएगा।

--qformat
दावा करें कि क्वेरी अनुक्रम डेटाबेस फ़ाइल प्रारूप में है . स्वीकृत प्रारूप
शामिल उपवास, प्रतीक चिन्ह, जेनबैंक, डीडीबीजे, स्टॉकहोम, पीएफएएम, ए2एम, एएफए, समूह, और फ़िलिप
डिफ़ॉल्ट फ़ाइल के प्रारूप का स्वतः पता लगाना है।

--चमक
से मॉडलों का एक उपसमूह कॉन्फ़िगर करें इसके बजाय, ग्लोकल संरेखण मोड में
स्थानीय मोड, अर्थात् फ़ाइल में सूचीबद्ध मॉडल . अन्य सभी मॉडल कॉन्फ़िगर करें
(जो सूचीबद्ध नहीं हैं ) स्थानीय मोड में. यह विकल्प असंगत है -जी।
पट्टिका मॉडलों के वैध नाम अवश्य सूचीबद्ध करें , प्रत्येक को किसी से अलग किया गया
व्हाईटस्पेस वर्ण (उदाहरण के लिए एक न्यूलाइन वर्ण)।

--सी पी यू
समानांतर कार्यकर्ता थ्रेड्स की संख्या को सेट करें . डिफ़ॉल्ट रूप से, इनफर्नल इसे सेट करता है
सीपीयू कोर की संख्या के लिए यह आपकी मशीन में पता लगाता है - यानी, यह कोशिश करता है
अपने उपलब्ध प्रोसेसर कोर का अधिकतम उपयोग करें। स्थापना से अधिक है
यदि कोई मूल्य हो तो उपलब्ध कोर की संख्या बहुत कम है, लेकिन आप इसे इस पर सेट करना चाह सकते हैं
कुछ कम। आप परिवेश सेट करके भी इस संख्या को नियंत्रित कर सकते हैं
चर, INFERNAL_NCPU। यह विकल्प केवल तभी उपलब्ध होता है जब इनफर्नल को संकलित किया गया हो
पॉज़िक्स थ्रेड्स सपोर्ट के साथ। यह डिफ़ॉल्ट है, लेकिन हो सकता है कि इसे बंद कर दिया गया हो
किसी कारण से आपकी साइट या मशीन के लिए संकलन-समय।

--स्टाल
MPI मास्टर/वर्कर संस्करण को डीबग करने के लिए: प्रारंभ करने के बाद रोकें, सक्षम करने के लिए
डिबगर्स को चल रहे मास्टर और वर्कर (ओं) प्रक्रियाओं में संलग्न करने के लिए डेवलपर। भेजना
विराम जारी करने के लिए SIGCONT संकेत। (जीडीबी के तहत: (GDB) संकेत सिगकॉन्ट) (केवल
उपलब्ध है यदि वैकल्पिक MPI समर्थन संकलन-समय पर सक्षम किया गया था।)

--एमपीआई MPI मास्टर/वर्कर मोड में चलाएँ, का उपयोग कर एमपिरुन (केवल वैकल्पिक एमपीआई होने पर ही उपलब्ध है
समर्थन संकलन-समय पर सक्षम किया गया था।)

onworks.net सेवाओं का उपयोग करके ऑनलाइन cmscan का उपयोग करें


फ्री सर्वर और वर्कस्टेशन

विंडोज और लाइनेक्स एप डाउनलोड करें

लिनक्स कमांड

Ad




×
विज्ञापन
❤️यहां खरीदारी करें, बुक करें या खरीदें - कोई शुल्क नहीं, इससे सेवाएं निःशुल्क बनी रहती हैं।