जैकहमर - क्लाउड में ऑनलाइन

यह कमांड जैकहैमर है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।

कार्यक्रम:

नाम


जैकहमर - एक प्रोटीन डेटाबेस के विरुद्ध पुनरावृत्तीय खोज अनुक्रम

SYNOPSIS


जैकहमेर [विकल्प]

वर्णन


जैकहमेर प्रत्येक क्वेरी अनुक्रम को पुनरावर्ती रूप से खोजता है लक्ष्य के विरुद्ध
अनुक्रम(ओं) में . पहला पुनरावृत्ति a के समान है fmmer खोजना। के लिए
अगला पुनरावृत्ति, सभी लक्ष्य अनुक्रमों के साथ क्वेरी का एक एकाधिक संरेखण
संतोषजनक समावेश थ्रेसहोल्ड इकट्ठा किया जाता है, इस संरेखण से एक प्रोफ़ाइल का निर्माण किया जाता है
(उपयोग करने के समान हम्मबिल्ड संरेखण पर), और प्रोफ़ाइल खोज पूरा हो गया है
(एक के समान हम्मसर्च प्रोफ़ाइल के साथ)।

पूछताछ हो सकता है '-' (एक डैश कैरेक्टर), जिस स्थिति में क्वेरी अनुक्रम हैं
a . से पढ़ें फ़ाइल के बजाय पाइप। NS a . से पढ़ा नहीं जा सकता
स्ट्रीम, क्योंकि जैकहमेर डेटाबेस पर एकाधिक पास करने की आवश्यकता है।

आउटपुट स्वरूप मानव-पठनीय होने के लिए डिज़ाइन किया गया है, लेकिन अक्सर इतना बड़ा होता है कि
इसे पढ़ना अव्यावहारिक है, और इसे पार्स करना एक दर्द है। NS --tbloout और --डॉमटब्लाउट विकल्पों
सरल सारणीबद्ध प्रारूपों में आउटपुट सहेजें जो संक्षिप्त और पार्स करने में आसान हों। NS -o विकल्प
मुख्य आउटपुट को पुनर्निर्देशित करने की अनुमति देता है, जिसमें इसे /dev/null में फेंकना भी शामिल है।

विकल्प


-h मदद; कमांड लाइन उपयोग और सभी उपलब्ध विकल्पों का एक संक्षिप्त अनुस्मारक प्रिंट करें।

-N पुनरावृत्तियों की अधिकतम संख्या निर्धारित करें . डिफ़ॉल्ट 5 है। यदि N=1, तो परिणाम
एक के बराबर है fmmer खोज।

विकल्प नियंत्रित आउटपुट


डिफ़ॉल्ट रूप से, प्रत्येक पुनरावृत्ति के लिए आउटपुट कुछ हद तक मानव पठनीय में stdout पर दिखाई देता है,
कुछ हद तक पार्स करने योग्य प्रारूप। ये विकल्प उस आउटपुट को पुनर्निर्देशित करने या सहेजने की अनुमति देते हैं
प्रत्येक पुनरावृत्ति के लिए चेकपॉइंट फ़ाइलों सहित फ़ाइलों के लिए अतिरिक्त प्रकार के आउटपुट।

-o मानव-पठनीय आउटपुट को किसी फ़ाइल पर निर्देशित करें .

-A अंतिम पुनरावृत्ति के बाद, सभी हिट्स का एक एनोटेटेड एकाधिक संरेखण सहेजें
संतोषजनक समावेशन सीमाएँ (मूल क्वेरी सहित)। in
स्टॉकहोम प्रारूप.

--tbloout
अंतिम पुनरावृत्ति के बाद, शीर्ष अनुक्रम हिट का एक सारणीबद्ध सारांश सहेजें में
आसानी से पार्स करने योग्य, स्तंभाकार, रिक्त स्थान-सीमांकित प्रारूप।

--डॉमटब्लाउट
अंतिम पुनरावृत्ति के बाद, शीर्ष डोमेन हिट का एक सारणीबद्ध सारांश सहेजें में
आसानी से पार्स करने योग्य, स्तंभाकार, रिक्त स्थान-सीमांकित प्रारूप।

--चख्म
प्रत्येक पुनरावृत्ति की शुरुआत में, क्वेरी HMM को चेकपॉइंट करें, इसे नामित फ़ाइल में सहेजें
- ।हम्म जहां पुनरावृत्ति संख्या है (1..एन से)।

--चकली
प्रत्येक पुनरावृत्ति के अंत में, संतोषजनक सभी डोमेन का संरेखण जांचें
समावेशन सीमाएँ (उदाहरण के लिए अगले पुनरावृत्ति के लिए क्वेरी HMM क्या बनेगी),
इसे नाम की फ़ाइल में सहेजना <चेकपॉइंट पट्टिका उपसर्ग>- .sto स्टॉकहोम प्रारूप में,
जहां पुनरावृत्ति संख्या है (1..एन से)।

--एसीसी मुख्य आउटपुट में नामों के बजाय एक्सेस का उपयोग करें, जहां प्रोफाइल के लिए उपलब्ध हो
और/या अनुक्रम।

--नोअली
मुख्य आउटपुट से संरेखण अनुभाग को छोड़ दें। यह आउटपुट को बहुत कम कर सकता है
मात्रा।

--notextw
मुख्य आउटपुट में प्रत्येक पंक्ति की लंबाई को सीमित करें। डिफ़ॉल्ट 120 . की सीमा है
प्रति पंक्ति वर्ण, जो टर्मिनलों पर आउटपुट को स्पष्ट रूप से प्रदर्शित करने में मदद करता है और
संपादकों में, लेकिन लक्ष्य प्रोफ़ाइल विवरण पंक्तियों को छोटा कर सकता है।

--textw
मुख्य आउटपुट की लाइन लंबाई सीमा को सेट करें प्रति पंक्ति वर्ण। डिफ़ॉल्ट है
120.

विकल्प नियंत्रित एकमात्र दृश्य स्कोरिंग (पहला पुनरावृत्ति)


डिफ़ॉल्ट रूप से, पहला पुनरावृत्ति एकल क्वेरी से निर्मित खोज मॉडल का उपयोग करता है
अनुक्रम। यह मॉडल अवशेषों के लिए मानक 20x20 प्रतिस्थापन मैट्रिक्स का उपयोग करके बनाया गया है
संभावनाएं, और स्थिति-स्वतंत्र गैप ओपन और गैप के लिए दो अतिरिक्त पैरामीटर
संभावनाओं का विस्तार करें. ये विकल्प डिफ़ॉल्ट एकल-अनुक्रम स्कोरिंग पैरामीटर की अनुमति देते हैं
परिवर्तित करने की।

--पॉपेन
एकल अनुक्रम क्वेरी मॉडल के लिए गैप ओपन प्रायिकता सेट करें । डिफ़ॉल्ट
एक्सएनएनएक्स है। >= 0 और <0.5 होना चाहिए।

--pextend
एकल अनुक्रम क्वेरी मॉडल के लिए गैप एक्सटेंड प्रायिकता सेट करें
डिफ़ॉल्ट 0.4 है। >= 0 और <1.0 होना चाहिए।

--एमएक्स
नामित प्रतिस्थापन मैट्रिक्स से अवशेष संरेखण संभावनाएं प्राप्त करें
. कई मानक मैट्रिक्स बिल्ट-इन हैं, और इन्हें पढ़ने की आवश्यकता नहीं है
फ़ाइलें। मैट्रिक्स का नाम PAM30, PAM70, PAM120, PAM240, BLOSUM45 हो सकता है,
BLOSUM50, BLOSUM62, BLOSUM80, या BLOSUM90। में से केवल एक --एमएक्स और --mxफ़ाइल
विकल्पों का उपयोग किया जा सकता है।

--mxफ़ाइल
फ़ाइल में प्रतिस्थापन मैट्रिक्स से अवशेष संरेखण संभावनाएं प्राप्त करें
. डिफ़ॉल्ट स्कोर मैट्रिक्स BLOSUM62 है (यह मैट्रिक्स HMMER के लिए आंतरिक है
और फ़ाइल के रूप में उपलब्ध होने की आवश्यकता नहीं है)। एक प्रतिस्थापन मैट्रिक्स का प्रारूप
BLAST, FASTA, और अन्य अनुक्रम द्वारा स्वीकृत मानक प्रारूप है
विश्लेषण सॉफ्टवेयर.

विकल्प नियंत्रित रिपोर्टिंग थ्रेसहोल्ड


रिपोर्टिंग थ्रेशोल्ड नियंत्रित करता है कि कौन से हिट आउटपुट फाइलों में रिपोर्ट किए जाते हैं (मुख्य आउटपुट,
--tbloout, तथा --डॉमटब्लाउट). प्रत्येक पुनरावृत्ति में, अनुक्रम हिट और डोमेन हिट को रैंक किया जाता है
सांख्यिकीय महत्व (ई-वैल्यू) द्वारा और आउटपुट दो खंडों में उत्पन्न होता है जिसे प्रति कहा जाता है-
लक्ष्य और प्रति-डोमेन आउटपुट। प्रति-लक्ष्य आउटपुट में, डिफ़ॉल्ट रूप से, सभी अनुक्रम एक के साथ हिट होते हैं
ई-वैल्यू <= 10 बताई गई है। प्रति-डोमेन आउटपुट में, प्रत्येक लक्ष्य के लिए जो प्रति-
लक्ष्य रिपोर्टिंग सीमाएँ, सभी डोमेन प्रति-डोमेन रिपोर्टिंग सीमाएँ संतुष्ट करते हैं
की सूचना दी। डिफ़ॉल्ट रूप से, ये <= 10 के सशर्त ई-मान वाले डोमेन हैं। निम्नलिखित
विकल्प आपको डिफ़ॉल्ट ई-वैल्यू रिपोर्टिंग सीमाएँ बदलने, या बिट स्कोर का उपयोग करने की अनुमति देते हैं
इसके बजाय दहलीज।

-E ई-मानों के साथ अनुक्रमों की रिपोर्ट करें <= प्रति-अनुक्रम आउटपुट में। डिफ़ॉल्ट 10.0 है.

-T ई-वैल्यू थ्रेशोल्ड के बजाय प्रति-अनुक्रम आउटपुट के लिए बिट स्कोर थ्रेशोल्ड का उपयोग करें
(कोई भी सेटिंग -E नजरअंदाज कर दिया जाता है)। >= के बिट स्कोर के साथ अनुक्रमों की रिपोर्ट करें । द्वारा
डिफ़ॉल्ट यह विकल्प अनसेट है.

-Z डेटाबेस का कुल आकार घोषित करें ई-वैल्यू के प्रयोजनों के लिए अनुक्रम
गणना। आम तौर पर ई-मानों की गणना डेटाबेस के आकार के सापेक्ष की जाती है
आपने वास्तव में खोजा (उदाहरण के लिए अनुक्रमों की संख्या)। target_seqdb). कुछ में
मामले (उदाहरण के लिए, यदि आपने अपने लक्ष्य अनुक्रम डेटाबेस को एकाधिक में विभाजित किया है
आपकी खोज के समानांतरीकरण के लिए फ़ाइलें), आप बेहतर जान सकते हैं कि वास्तविक आकार क्या है
आपके खोज स्थान का है.

--डोमई
सशर्त ई-मानों वाले डोमेन की रिपोर्ट करें <= इसके अतिरिक्त, प्रति-डोमेन आउटपुट में
प्रति महत्वपूर्ण अनुक्रम हिट शीर्ष स्कोरिंग डोमेन तक। डिफ़ॉल्ट 10.0 है.

--डोमटी
ई-वैल्यू थ्रेशोल्ड के बजाय प्रति-डोमेन आउटपुट के लिए बिट स्कोर थ्रेशोल्ड का उपयोग करें
(कोई भी सेटिंग --डोमटी नजरअंदाज कर दिया जाता है)। >= के बिट स्कोर वाले डोमेन की रिपोर्ट करें in
प्रति-डोमेन आउटपुट, प्रति महत्वपूर्ण अनुक्रम में शीर्ष-स्कोरिंग डोमेन के अतिरिक्त
मारना। डिफ़ॉल्ट रूप से यह विकल्प अनसेट है.

--डोमजेड
होने वाले महत्वपूर्ण अनुक्रमों की संख्या घोषित करें अनुक्रम, प्रयोजनों के लिए
अतिरिक्त डोमेन महत्व के लिए सशर्त ई-मूल्य गणना। सामान्य रूप से
सशर्त ई-मानों की गणना गुजरने वाले अनुक्रमों की संख्या के सापेक्ष की जाती है
प्रति-अनुक्रम रिपोर्टिंग सीमा.

विकल्प नियंत्रित समावेशन थ्रेसहोल्ड


समावेशन सीमाएँ नियंत्रित करती हैं कि कौन से हिट एकाधिक संरेखण और प्रोफ़ाइल में शामिल हैं
अगले खोज पुनरावृत्ति के लिए निर्मित। डिफ़ॉल्ट रूप से, एक अनुक्रम में प्रति होना चाहिए-
अनुक्रम ई-मूल्य <= 0.001 (देखें -E विकल्प) शामिल किया जाना है, और कोई भी अतिरिक्त डोमेन शामिल है
शीर्ष स्कोरिंग के अलावा इसका सशर्त ई-मान <= 0.001 होना चाहिए (देखें)। --डोमई
विकल्प)। रिपोर्टिंग सीमा और समावेशन सीमा के बीच अंतर यही है
समावेशन थ्रेशोल्ड नियंत्रित करते हैं कि कौन से हिट वास्तव में अगले पुनरावृत्ति (या) में उपयोग किए जाते हैं
अंतिम आउटपुट एकाधिक संरेखण यदि -A विकल्प का उपयोग किया जाता है), जबकि रिपोर्टिंग सीमाएँ
आप आउटपुट में जो देखते हैं उसे नियंत्रित करें। रिपोर्टिंग सीमाएँ आम तौर पर अधिक ढीली होती हैं इसलिए आप ऐसा कर सकते हैं
शोर के शीर्ष पर सीमा रेखा हिट देखें जो रुचिकर हो सकते हैं।

--incई
ई-मानों के साथ अनुक्रम शामिल करें <= आगामी पुनरावृत्ति या अंतिम संरेखण में
द्वारा आउटपुट -A. डिफ़ॉल्ट 0.001 है।

--incT
ई-वैल्यू के बजाय प्रति-अनुक्रम समावेशन के लिए बिट स्कोर सीमा का उपयोग करें
दहलीज (कोई भी सेटिंग) --incई नजरअंदाज कर दिया जाता है)। के बिट स्कोर के साथ अनुक्रम शामिल करें
>= . डिफ़ॉल्ट रूप से यह विकल्प अनसेट है.

--incdomE
सशर्त ई-मानों वाले डोमेन शामिल करें <= आगामी पुनरावृत्ति या अंतिम में
संरेखण आउटपुट द्वारा -A, प्रति महत्वपूर्ण शीर्ष स्कोरिंग डोमेन के अलावा
अनुक्रम हिट. डिफ़ॉल्ट 0.001 है.

--incdom टी
ई-वैल्यू थ्रेशोल्ड के बजाय प्रति-डोमेन समावेशन के लिए बिट स्कोर थ्रेशोल्ड का उपयोग करें
(कोई भी सेटिंग --incT नजरअंदाज कर दिया जाता है)। >= के बिट स्कोर वाले डोमेन शामिल करें । द्वारा
डिफ़ॉल्ट यह विकल्प अनसेट है.

विकल्प नियंत्रित त्वरण heuristics


HMMER3 खोजों को तीन-चरण फ़िल्टर पाइपलाइन में त्वरित किया जाता है: MSV फ़िल्टर, the
Viterbi फ़िल्टर, और फ़ॉरवर्ड फ़िल्टर। पहला फ़िल्टर सबसे तेज़ और सबसे अधिक
अनुमानित; अंतिम पूर्ण फॉरवर्ड स्कोरिंग एल्गोरिथम है, सबसे धीमा लेकिन सबसे सटीक।
MSV और Viterbi के बीच एक पूर्वाग्रह फ़िल्टर चरण भी है। लक्ष्य जो सभी चरणों को पार करते हैं
त्वरण पाइपलाइन में तब पोस्टप्रोसेसिंग के अधीन होते हैं -- डोमेन पहचान
और फॉरवर्ड/बैकवर्ड एल्गोरिथम का उपयोग करके स्कोरिंग।

एचएमएमईआर के अनुमानी फिल्टर को नियंत्रित करने वाले अनिवार्य रूप से एकमात्र मुक्त पैरामीटर पी-
गैर-होमोलॉजिकल अनुक्रमों के अपेक्षित अंश को नियंत्रित करने वाले मूल्य थ्रेसहोल्ड जो पास होते हैं
फिल्टर। डिफ़ॉल्ट थ्रेशोल्ड को उच्चतर सेट करना . का उच्च अनुपात पारित करेगा
गैर-समरूप अनुक्रम, गति की कीमत पर संवेदनशीलता बढ़ाना; इसके विपरीत,
कम पी-मान थ्रेसहोल्ड सेट करने से संवेदनशीलता कम हो जाएगी, एक छोटा अनुपात पारित हो जाएगा
और गति बढ़ रही है। किसी फ़िल्टर का P-मान थ्रेशोल्ड 1.0 पर सेट करने का अर्थ है कि वह गुजर जाएगा
सभी अनुक्रम, और प्रभावी रूप से फ़िल्टर को अक्षम करता है।

फ़िल्टर थ्रेशोल्ड को बदलने से केवल लक्ष्य हटा दिए जाते हैं या विचार किए जाते हैं; बदलना
फ़िल्टर थ्रेशोल्ड बिट स्कोर, ई-मान या संरेखण को नहीं बदलता है, जो सभी हैं
पूरी तरह से पोस्टप्रोसेसिंग में निर्धारित।

--मैक्स अधिकतम संवेदनशीलता। पूर्वाग्रह फ़िल्टर सहित सभी फ़िल्टर बंद करें, और पूरा चलाएं
हर लक्ष्य पर आगे/पिछड़े पोस्टप्रोसेसिंग। इससे संवेदनशीलता बढ़ती है
थोड़ा, गति में बड़ी कीमत पर।

--F1
पहला फ़िल्टर थ्रेशोल्ड; MSV फ़िल्टर चरण के लिए P-मान थ्रेशोल्ड सेट करें। NS
डिफ़ॉल्ट 0.02 है, जिसका अर्थ है कि उच्चतम स्कोरिंग गैर-समरूप का लगभग 2%
लक्ष्य फ़िल्टर पास करने की उम्मीद है।

--F2
दूसरा फ़िल्टर थ्रेशोल्ड; Viterbi फ़िल्टर चरण के लिए P-मान थ्रेशोल्ड सेट करें।
डिफ़ॉल्ट 0.001 है।

--F3
तीसरा फ़िल्टर थ्रेशोल्ड; फ़ॉरवर्ड फ़िल्टर चरण के लिए P-मान थ्रेशोल्ड सेट करें। NS
डिफ़ॉल्ट 1e-5 है।

--नोबियास
बायस फिल्टर को बंद कर दें। यह कुछ हद तक संवेदनशीलता बढ़ाता है, लेकिन एक पर आ सकता है
गति में उच्च लागत, विशेष रूप से यदि क्वेरी में पक्षपाती अवशेष संरचना है (जैसे
एक दोहराव अनुक्रम क्षेत्र, या यदि यह बड़े क्षेत्रों के साथ एक झिल्ली प्रोटीन है
हाइड्रोफोबिसिटी)। पूर्वाग्रह फ़िल्टर के बिना, बहुत से अनुक्रम फ़िल्टर को पास कर सकते हैं
पक्षपातपूर्ण प्रश्नों के साथ, अपेक्षित प्रदर्शन की तुलना में धीमी गति के लिए अग्रणी
कम्प्यूटेशनल रूप से गहन फॉरवर्ड/बैकवर्ड एल्गोरिदम एक असामान्य रूप से भारी कंधे
भार।

विकल्प नियंत्रित शख्सियत निर्माण (बाद में पुनरावृत्तियाँ)


ये विकल्प नियंत्रित करते हैं कि सर्वसम्मति कॉलम को एकाधिक संरेखण में कैसे परिभाषित किया जाता है
प्रोफ़ाइल बनाना. डिफ़ॉल्ट रूप से, जैकहमेर इसमें हमेशा आपका मूल क्वेरी अनुक्रम शामिल होता है
प्रत्येक पुनरावृत्ति पर संरेखण परिणाम, और सर्वसम्मति की स्थिति उस क्वेरी द्वारा परिभाषित की जाती है
अनुक्रम: यानी, एक डिफ़ॉल्ट जैकहमेर प्रोफ़ाइल की लंबाई हमेशा आपकी मूल लंबाई के समान होती है
प्रत्येक पुनरावृत्ति पर क्वेरी।

--तेज़ सर्वसम्मति कॉलम को उन लोगों के रूप में परिभाषित करें जिनके पास एक अंश है >= सिम्फैक अवशेषों के रूप में
अंतराल के विपरीत। (के लिए नीचे देखें --सिम्फैक विकल्प.) हालाँकि यह डिफ़ॉल्ट है
प्रोफ़ाइल निर्माण विकल्प अन्यत्र (में) हम्मबिल्ड, विशेष रूप से), यह हो सकता है
में अवांछनीय प्रभाव जैकहमेर, क्योंकि एक प्रोफ़ाइल पुनरावृत्तीय रूप से चल सकती है
आपकी मूल क्वेरी से दूर अनुक्रम स्थान, कुछ या कोई आम सहमति कॉलम नहीं छोड़ना
इसके अवशेषों के अनुरूप।

--हाथ मल्टीपल के संदर्भ एनोटेशन का उपयोग करके अगली प्रोफ़ाइल में सर्वसम्मति कॉलम को परिभाषित करें
संरेखण। जैकहमेर पिछली प्रोफ़ाइल से संदर्भ एनोटेशन का प्रचार करता है
एकाधिक संरेखण, और उसके बाद अगली प्रोफ़ाइल पर। यह डिफ़ॉल्ट है.

--सिम्फैक
सर्वसम्मति कॉलम को परिभाषित करने के लिए आवश्यक अवशेष अंश सीमा को परिभाषित करें जब
का उपयोग --तेज़ विकल्प। डिफ़ॉल्ट 0.5 है। प्रत्येक कॉलम में प्रतीक भिन्न है
सापेक्ष अनुक्रम भार को ध्यान में रखते हुए और अंतराल को अनदेखा करने के बाद गणना की जाती है
अनुक्रम अंशों के सिरों के अनुरूप वर्ण (आंतरिक के विपरीत)
सम्मिलन/विलोपन)। इसे 0.0 पर सेट करने का अर्थ है कि प्रत्येक संरेखण कॉलम होगा
आम सहमति के रूप में सौंपा जाना चाहिए, जो कुछ मामलों में उपयोगी हो सकता है। इसे 1.0 . पर सेट करना
इसका मतलब है कि केवल कॉलम जिसमें 0 गैप (आंतरिक सम्मिलन/विलोपन) शामिल हैं
सर्वसम्मति के रूप में सौंपा।

--फ्रैगथ्रेश
यदि संरेखित अनुक्रम ज्ञात है तो हम केवल टर्मिनल अंतराल को विलोपन के रूप में गिनना चाहते हैं
पूर्ण-लंबाई होने के लिए, यदि यह एक टुकड़ा नहीं है (उदाहरण के लिए, क्योंकि इसका केवल एक हिस्सा है
अनुक्रमित किया गया था)। HMMER टुकड़ों का अनुमान लगाने के लिए एक सरल नियम का उपयोग करता है: यदि अनुक्रम लंबाई
L एक भिन्न से छोटा या उसके बराबर है स्तंभों में संरेखण लंबाई का गुना,
फिर अनुक्रम को एक टुकड़े के रूप में संभाला जाता है। डिफ़ॉल्ट 0.5 है. सेटिंग
--फ्रैगथ्रेश0 किसी भी (गैर-रिक्त) अनुक्रम को एक टुकड़े के रूप में परिभाषित करेगा; हो सकता है कि आप यह चाहते हों
ऐसा करें यदि आप जानते हैं कि आपको पूर्ण-लंबाई का सावधानीपूर्वक तैयार किया गया संरेखण मिल गया है
क्रम. सेटिंग --फ्रैगथ्रेश1 सभी अनुक्रमों को टुकड़ों के रूप में परिभाषित करेगा; आप शायद
यदि आप जानते हैं कि आपका संरेखण पूरी तरह से टुकड़ों से बना है, तो आप ऐसा करना चाहेंगे
जैसा अनुवादित संक्षेप में मेटागेनोमिक शॉटगन डेटा में पढ़ा जाता है।

विकल्प नियंत्रित RELATIVE वजन


जब भी कोई प्रोफ़ाइल एकाधिक संरेखण से बनाई जाती है, तो HMMER एक तदर्थ अनुक्रम का उपयोग करता है
निकट संबंधी अनुक्रमों को कम करने और दूरस्थ रूप से संबंधित अनुक्रमों को बढ़ाने के लिए वेटिंग एल्गोरिदम
वाले. इसका असर मॉडलों को असमान फ़ाइलोजेनेटिक द्वारा कम पक्षपाती बनाने में होता है
प्रतिनिधित्व. उदाहरण के लिए, दो समान अनुक्रम आम तौर पर प्रत्येक को आधा प्राप्त होगा
एक अनुक्रम जितना वजन देगा (और यही कारण है जैकहमेर हमेशा के बारे में चिंतित नहीं है
प्रत्येक पुनरावृत्ति के संरेखण में अपना मूल क्वेरी अनुक्रम शामिल करें, भले ही उसे वह मिल जाए
फिर से उस डेटाबेस में जिसे आप खोज रहे हैं)। ये विकल्प नियंत्रित करते हैं कि कौन सा एल्गोरिदम उपयोग किया जाए।

--wpb हेनिकॉफ़ स्थिति-आधारित अनुक्रम भार योजना का उपयोग करें [हेनिकॉफ़ और हेनिकॉफ़,
जे. मोल. बायोल। 243:574, 1994]। यह डिफ़ॉल्ट है।

--wgsc गेरस्टीन/सोनहैमर/चोथिया वेटिंग एल्गोरिथम का प्रयोग करें [गेर्स्टीन एट अल, जे. मोल।
बायोल। 235:1067, 1994].

--wblosum
उसी क्लस्टरिंग योजना का उपयोग करें जिसका उपयोग BLOSUM की गणना में डेटा भारित करने के लिए किया गया था
प्रतिस्थापन मैट्रिसेस [हेनिकॉफ़ और हेनिकॉफ़, प्रोक। नेटल। एकेड। विज्ञान 89:10915, 1992]।
अनुक्रम एकल-लिंकेज एक पहचान सीमा पर क्लस्टर किए जाते हैं (डिफ़ॉल्ट 0.62; देखें .)
--विडो) और c अनुक्रमों के प्रत्येक समूह के भीतर, प्रत्येक अनुक्रम को सापेक्ष भार प्राप्त होता है
1/सी.

--कोई नहीं
कोई सापेक्ष वजन नहीं। सभी अनुक्रमों को एक समान भार सौंपा गया है।

--विडो
उपयोग करते समय सिंगल-लिंकेज क्लस्टरिंग द्वारा उपयोग की जाने वाली पहचान सीमा निर्धारित करता है --wblosum.
किसी अन्य भारोत्तोलन योजना के साथ अमान्य। डिफ़ॉल्ट 0.62 है।

विकल्प नियंत्रित प्रभावी दृश्य नंबर


सापेक्ष भार निर्धारित होने के बाद, उन्हें कुल प्रभावी के योग के लिए सामान्यीकृत किया जाता है
क्रम संख्या, eff_nseq. यह संख्या अनुक्रमों की वास्तविक संख्या हो सकती है
संरेखण, लेकिन यह लगभग हमेशा उससे छोटा होता है। डिफ़ॉल्ट एन्ट्रापी भारोत्तोलन
तरीका (--ईएनटी) सूचना सामग्री को कम करने के लिए प्रभावी अनुक्रम संख्या को कम करता है
(सापेक्ष एन्ट्रापी, या सच्चे होमोलॉग पर औसत अपेक्षित स्कोर) प्रति सर्वसम्मति की स्थिति। NS
लक्ष्य सापेक्ष एन्ट्रापी को दो-पैरामीटर फ़ंक्शन द्वारा नियंत्रित किया जाता है, जहां दो
पैरामीटर के साथ व्यवस्थित हैं --रे और --एसिग्मा.

--ईंट एक विशिष्ट सापेक्ष एन्ट्रापी प्रति प्राप्त करने के लिए प्रभावी अनुक्रम संख्या समायोजित करें
स्थिति (देखें --रे) यह डिफ़ॉल्ट है।

--एक्लस्ट
एकल-लिंकेज समूहों की संख्या के लिए प्रभावी अनुक्रम संख्या सेट करें a
विशिष्ट पहचान सीमा (देखें --ईद) यह विकल्प अनुशंसित नहीं है; इसके लिए है
प्रयोग कितना बेहतर मूल्यांकन करते हैं --ईंट है.

--एनोन
प्रभावी अनुक्रम संख्या निर्धारण को बंद करें और केवल वास्तविक संख्या का उपयोग करें
क्रम ऐसा करने का एक कारण यह हो सकता है कि आप रिश्तेदार को अधिकतम करने का प्रयास करें
आपके मॉडल की एन्ट्रापी/स्थिति, जो लघु मॉडल के लिए उपयोगी हो सकती है।

--सेट
सभी मॉडलों के लिए प्रभावी अनुक्रम संख्या को स्पष्ट रूप से सेट करें .

--रे
न्यूनतम सापेक्ष एन्ट्रापी/स्थिति लक्ष्य को सेट करें । आवश्यक है --ईंट। चूक
अनुक्रम वर्णमाला पर निर्भर करता है; प्रोटीन अनुक्रमों के लिए, यह 0.59 बिट/स्थिति है।

--एसिग्मा
संपूर्ण मॉडल संरेखण द्वारा योगदान की गई न्यूनतम सापेक्ष एन्ट्रापी सेट करता है, ओवर
इसकी पूरी लंबाई। यह छोटे मॉडल बनाने का प्रभाव उच्च सापेक्ष है
की तुलना में प्रति स्थिति एन्ट्रापी --रे अकेले देंगे। डिफ़ॉल्ट 45.0 बिट है।

--ईद
के साथ एकल लिंकेज क्लस्टरिंग द्वारा उपयोग किए जाने वाले भिन्नात्मक जोड़ीवार पहचान कटऑफ सेट करता है
la --एक्लस्ट विकल्प। डिफ़ॉल्ट 0.62 है।

विकल्प नियंत्रित महंतों


प्रोफ़ाइल निर्माण में, डिफ़ॉल्ट रूप से, भारित गणनाओं को माध्य पश्च में परिवर्तित किया जाता है
मिश्रण डिरिचलेट प्रीर्स का उपयोग करके संभाव्यता पैरामीटर अनुमान। डिफ़ॉल्ट मिश्रण डिरिचलेट
प्रोटीन मॉडल और न्यूक्लिक एसिड (आरएनए और डीएनए) मॉडल के लिए पूर्व पैरामीटर बनाए गए हैं
निम्नलिखित विकल्प आपको डिफ़ॉल्ट पूर्व को ओवरराइड करने की अनुमति देते हैं।

--पनोन किसी भी पूर्व का प्रयोग न करें। संभाव्यता पैरामीटर केवल देखे जाएंगे
आवृत्तियों, सापेक्ष अनुक्रम भार के बाद।

--प्लाप्लेस डिरिचलेट पूर्व के डिफ़ॉल्ट मिश्रण के स्थान पर पहले लैपलेस +1 का उपयोग करें।

विकल्प नियंत्रित ई-मूल्य अंशांकन


MSV फ़िल्टर के लिए अपेक्षित स्कोर वितरण के लिए स्थान पैरामीटर का अनुमान लगाना
स्कोर, Viterbi फ़िल्टर स्कोर और फ़ॉरवर्ड स्कोर के लिए तीन छोटे यादृच्छिक अनुक्रम की आवश्यकता होती है
सिमुलेशन।

--ईएमएल
सिमुलेशन में अनुक्रम लंबाई सेट करता है जो स्थान पैरामीटर mu for . का अनुमान लगाता है
MSV फ़िल्टर ई-मान। डिफ़ॉल्ट 200 है।

--ईएमएन
सिमुलेशन में अनुक्रमों की संख्या सेट करता है जो स्थान पैरामीटर का अनुमान लगाता है mu
MSV फ़िल्टर ई-मानों के लिए। डिफ़ॉल्ट 200 है।

--ईवीएल
सिमुलेशन में अनुक्रम लंबाई सेट करता है जो स्थान पैरामीटर mu for . का अनुमान लगाता है
Viterbi फ़िल्टर ई-मान। डिफ़ॉल्ट 200 है।

--ईवीएन
सिमुलेशन में अनुक्रमों की संख्या सेट करता है जो स्थान पैरामीटर का अनुमान लगाता है mu
Viterbi फ़िल्टर ई-मानों के लिए। डिफ़ॉल्ट 200 है।

--ईएफएल
सिमुलेशन में अनुक्रम लंबाई सेट करता है जो स्थान पैरामीटर ताऊ का अनुमान लगाता है
फॉरवर्ड ई-वैल्यू के लिए। डिफ़ॉल्ट 100 है।

--ईएफएन
सिमुलेशन में अनुक्रमों की संख्या सेट करता है जो स्थान पैरामीटर का अनुमान लगाता है
फॉरवर्ड ई-वैल्यू के लिए ताऊ। डिफ़ॉल्ट 200 है।

--इफ्ट
स्थान का अनुमान लगाने वाले सिमुलेशन में फ़िट होने के लिए टेल मास फ़्रैक्शन सेट करता है
फॉरवर्ड मूल्यांकन के लिए पैरामीटर ताऊ। डिफ़ॉल्ट 0.04 है।

अन्य विकल्प


--नॉनुल2
पक्षपाती रचना के लिए null2 स्कोर सुधार बंद करें।

-Z दावा करें कि आपकी खोजों में लक्ष्यों की कुल संख्या है , उद्देश्यों के लिये
लक्ष्य की वास्तविक संख्या के बजाय प्रति-अनुक्रम ई-मूल्य गणनाओं का
देखा।

--डोमजेड
दावा करें कि आपकी खोजों में लक्ष्यों की कुल संख्या है , उद्देश्यों के लिये
लक्ष्य की संख्या के बजाय प्रति-डोमेन सशर्त ई-मान गणनाओं का
जो रिपोर्टिंग सीमा को पार कर गया है।

--बीज
यादृच्छिक संख्या जनरेटर को सीड करें , एक पूर्णांक >= 0. यदि है>0, कोई भी
स्टोकेस्टिक सिमुलेशन प्रतिलिपि प्रस्तुत करने योग्य होंगे; वही आदेश वही देगा
परिणाम। अगर 0 है, यादृच्छिक संख्या जनरेटर को मनमाने ढंग से वरीयता दी जाती है, और
स्टोकेस्टिक सिमुलेशन एक ही कमांड के रन से रन के लिए अलग-अलग होंगे। डिफ़ॉल्ट
बीज 42 है।

--qformat
घोषणा करें कि इनपुट query_seqfile प्रारूप में है . स्वीकृत अनुक्रम फ़ाइल
प्रारूपों में FASTA, EMBL, GenBank, DDBJ, UniProt, Stockholm, और SELEX शामिल हैं। गलती करना
फ़ाइल के प्रारूप का स्वतः पता लगाना है।

--tformat
घोषणा करें कि इनपुट target_seqdb प्रारूप में है . स्वीकृत अनुक्रम फ़ाइल
प्रारूपों में FASTA, EMBL, GenBank, DDBJ, UniProt, Stockholm, और SELEX शामिल हैं। गलती करना
फ़ाइल के प्रारूप का स्वतः पता लगाना है।

--सी पी यू
समानांतर कार्यकर्ता थ्रेड्स की संख्या को सेट करें . डिफ़ॉल्ट रूप से, HMMER इसे इस पर सेट करता है
यह आपकी मशीन में सीपीयू कोर की संख्या का पता लगाता है - यानी, यह अधिकतम करने की कोशिश करता है
आपके उपलब्ध प्रोसेसर कोर का उपयोग। स्थापना की संख्या से अधिक
उपलब्ध कोर बहुत कम हैं यदि कोई मूल्य है, लेकिन आप इसे किसी चीज़ पर सेट करना चाह सकते हैं
कम। आप एक पर्यावरण चर सेट करके भी इस संख्या को नियंत्रित कर सकते हैं,
एचएमएमईआर_एनसीपीयू.

यह विकल्प केवल तभी उपलब्ध होता है जब HMMER को POSIX थ्रेड्स समर्थन के साथ संकलित किया गया हो।
यह डिफ़ॉल्ट है, लेकिन हो सकता है कि इसे आपकी साइट के लिए संकलन-समय पर बंद कर दिया गया हो
या किसी कारण से मशीन।

--स्टाल
MPI मास्टर/वर्कर संस्करण को डीबग करने के लिए: प्रारंभ करने के बाद रोकें, सक्षम करने के लिए
डिबगर्स को चल रहे मास्टर और वर्कर (ओं) प्रक्रियाओं में संलग्न करने के लिए डेवलपर। भेजना
विराम जारी करने के लिए SIGCONT संकेत। (जीडीबी के तहत: (GDB) संकेत सिगकॉन्ट) (केवल
उपलब्ध है यदि वैकल्पिक MPI समर्थन संकलन-समय पर सक्षम किया गया था।)

--एमपीआई MPI मास्टर/वर्कर मोड में चलाएँ, का उपयोग कर mpirun. (केवल तभी उपलब्ध है जब वैकल्पिक MPI
समर्थन संकलन-समय पर सक्षम किया गया था।)

onworks.net सेवाओं का उपयोग करके जैकह्मर का ऑनलाइन उपयोग करें



नवीनतम Linux और Windows ऑनलाइन प्रोग्राम