यह कमांड hmm2pfam है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
hmm2pfam - HMM डेटाबेस के विरुद्ध एक या अधिक अनुक्रम खोजें
SYNOPSIS
हम्म2pfam [विकल्प] हम्मफाइल सेक्फ़ाइल
वर्णन
हम्म2pfam एक अनुक्रम फ़ाइल पढ़ता है सेक्फ़ाइल और इसमें प्रत्येक अनुक्रम की एक-एक करके तुलना करता है,
सभी एचएमएम के खिलाफ हम्मफाइल काफी समान अनुक्रम मिलानों की तलाश है।
हम्मफाइल पहले वर्तमान कार्यशील निर्देशिका में खोजा जाएगा, फिर किसी निर्देशिका में
पर्यावरण चर द्वारा नामित HMMERDB. यह प्रशासकों को एचएमएम स्थापित करने देता है
एक सामान्य स्थान पर Pfam जैसी लाइब्रेरी।
प्रत्येक अनुक्रम के लिए एक अलग आउटपुट रिपोर्ट है seqfile. इस रिपोर्ट में शामिल हैं
तीन खंड: सर्वश्रेष्ठ स्कोरिंग एचएमएम की एक रैंक वाली सूची, सर्वश्रेष्ठ स्कोरिंग डोमेन की एक सूची
क्रम में उनकी घटना के क्रम में, और सभी सर्वोत्तम स्कोरिंग के लिए संरेखण
डोमेन. यदि अनुक्रम स्कोर समान अनुक्रम के लिए डोमेन स्कोर से अधिक हो सकता है
अनुक्रम में एक से अधिक डोमेन हैं; अनुक्रम स्कोर सभी को ध्यान में रखता है
डोमेन. सभी अनुक्रम ऊपर स्कोर कर रहे हैं -E और -T कटऑफ पहले में दिखाए गए हैं
तो फिर सूची प्रत्येक इस सूची में पाया गया डोमेन डोमेन हिट की दूसरी सूची में दिखाया गया है। अगर
वांछित, ई-वैल्यू और बिट स्कोर थ्रेशोल्ड का उपयोग करके डोमेन सूची पर भी लागू किया जा सकता है
--डोमई और --डोमटी विकल्प.
विकल्प
-h संक्षिप्त सहायता प्रिंट करें; संस्करण संख्या और सभी विकल्पों का सारांश शामिल है, जिसमें शामिल हैं
विशेषज्ञ विकल्प।
-n निर्दिष्ट करें कि मॉडल और अनुक्रम न्यूक्लिक एसिड हैं, प्रोटीन नहीं। अन्य हम्मर
प्रोग्राम इसका स्वत: पता लगा लेते हैं; लेकिन जिस क्रम में है उसके कारण हम्म2pfam डेटा तक पहुँचता है,
यह स्वयं विश्वसनीय रूप से सही "वर्णमाला" निर्धारित नहीं कर सकता है।
-A संरेखण आउटपुट को सीमित करता है सर्वोत्तम स्कोरिंग डोमेन. -A0 को बंद कर देता है
संरेखण आउटपुट और इसका उपयोग आउटपुट फ़ाइलों के आकार को कम करने के लिए किया जा सकता है।
-E प्रति-अनुक्रम रैंक वाली हिट सूची के लिए ई-वैल्यू कटऑफ़ सेट करें , जहां एक
सकारात्मक वास्तविक संख्या. डिफ़ॉल्ट 10.0 है. ई-वैल्यू वाले हिट्स (कम) से बेहतर हैं
थान) यह सीमा दिखाई जाएगी।
-T प्रति-अनुक्रम रैंक वाली हिट सूची के लिए बिट स्कोर कटऑफ़ सेट करें , जहां is
एक वास्तविक संख्या. डिफ़ॉल्ट ऋणात्मक अनंत है; डिफ़ॉल्ट रूप से, सीमा है
ई-वैल्यू द्वारा नियंत्रित न कि बिट स्कोर द्वारा। बिट स्कोर से बेहतर हिट
(इससे अधिक) यह सीमा दिखाई जाएगी.
-Z ई-वैल्यू स्कोर की गणना करें जैसे कि हमने अनुक्रम डेटाबेस देखा हो
क्रम. डिफ़ॉल्ट को मनमाने ढंग से 59021 पर सेट किया गया है, जो स्विसप्रोट 34 का आकार है।
विशेषज्ञ विकल्प
--एसीसी आउटपुट रिपोर्ट में नामों के बजाय एचएमएम एक्सेसेस की रिपोर्ट करें। उच्च के लिए उपयोगी-
थ्रूपुट एनोटेशन, जहां डेटा को रिलेशनल में भंडारण के लिए पार्स किया जा रहा है
डेटाबेस।
--compat
2.1.1-1998 सार्वजनिक रिलीज़, HMMER 2001 के आउटपुट स्वरूप का उपयोग करें; ऐसा प्रदान किया गया
2.1.1 पार्सर्स को दोबारा लिखने की आवश्यकता नहीं है।
--सी पी यू
सीपीयू की अधिकतम संख्या निर्धारित करता है जिस पर प्रोग्राम चलेगा। डिफ़ॉल्ट का उपयोग करना है
मशीन में सभी सीपीयू। HMMER_NCPU पर्यावरण चर को ओवरराइड करता है। केवल
HMMER के थ्रेडेड संस्करणों को प्रभावित करता है (अधिकांश सिस्टम पर डिफ़ॉल्ट)।
--कट_गा
Pfam GA (एकत्रीकरण सीमा) स्कोर कटऑफ़ का उपयोग करें। --ग्लोबटी के समतुल्य
--domT , लेकिन GA2 और GA1 कटऑफ प्रत्येक HMM से पढ़े जाते हैं हम्मफाइल
व्यक्तिगत रूप से. यदि संरेखण फ़ाइल थी तो hmm2build इन कटऑफ़ को वहां रखता है
Pfam-अनुकूल संरेखण प्रारूप (विस्तारित SELEX या स्टॉकहोम प्रारूप) में एनोटेट किया गया
और वैकल्पिक GA एनोटेशन लाइन मौजूद थी। यदि ये कटऑफ निर्धारित नहीं हैं
एचएमएम फ़ाइल, --कट_गा काम नहीं करता।
--कट_टीसी
पीएफएएम टीसी (विश्वसनीय कटऑफ) स्कोर कटऑफ का उपयोग करें। --ग्लोबटी के समतुल्य --domT
, लेकिन TC2 और TC1 कटऑफ प्रत्येक HMM से पढ़े जाते हैं हम्मफाइल व्यक्तिगत रूप से।
यदि संरेखण फ़ाइल को Pfam में एनोटेट किया गया था तो hmm2build इन कटऑफ को वहां रखता है-
अनुकूल संरेखण प्रारूप (विस्तारित SELEX या स्टॉकहोम प्रारूप) और वैकल्पिक टीसी
एनोटेशन लाइन मौजूद थी. यदि ये कटऑफ़ HMM फ़ाइल में सेट नहीं हैं, --कट_टीसी
काम नहीं करता।
--कट_एनसी
Pfam NC (शोर कटऑफ़) स्कोर कटऑफ़ का उपयोग करें। --ग्लोबटी के समतुल्य --domT ,
लेकिन एनसी1 और एनसी2 कटऑफ प्रत्येक एचएमएम से पढ़े जाते हैं हम्मफाइल व्यक्तिगत रूप से।
यदि संरेखण फ़ाइल को Pfam में एनोटेट किया गया था तो hmm2build इन कटऑफ को वहां रखता है-
अनुकूल संरेखण प्रारूप (विस्तारित SELEX या स्टॉकहोम प्रारूप) और वैकल्पिक NC
एनोटेशन लाइन मौजूद थी. यदि ये कटऑफ़ HMM फ़ाइल में सेट नहीं हैं, --कट_एनसी
काम नहीं करता।
--डोमई
प्रति डोमेन रैंक वाली हिट सूची के लिए ई-वैल्यू कटऑफ़ सेट करें , जहां एक
सकारात्मक वास्तविक संख्या. डिफ़ॉल्ट अनंत है; डिफ़ॉल्ट रूप से, सभी डोमेन
पहली सीमा पार करने वाले अनुक्रमों को दूसरी सूची में रिपोर्ट किया जाएगा
कि प्रति-अनुक्रम सूची में रिपोर्ट किए गए डोमेन की संख्या इसके अनुरूप है
वह संख्या जो प्रति-डोमेन सूची में दिखाई देती है।
--डोमटी
प्रति डोमेन रैंक वाली हिट सूची के लिए बिट स्कोर कटऑफ़ सेट करें , जहां एक
वास्तविक संख्या। डिफ़ॉल्ट ऋणात्मक अनंत है; डिफ़ॉल्ट रूप से, सभी डोमेन
पहली सीमा पार करने वाले अनुक्रमों को दूसरी सूची में रिपोर्ट किया जाएगा
कि प्रति-अनुक्रम सूची में रिपोर्ट किए गए डोमेन की संख्या इसके अनुरूप है
वह संख्या जो प्रति-डोमेन सूची में दिखाई देती है। महत्त्वपूर्ण नोट: ए में केवल एक डोमेन
अनुक्रम बिल्कुल इस पैरामीटर द्वारा नियंत्रित होता है, या इसके द्वारा --domT. दूसरा और
किसी क्रम में बाद के डोमेन की वास्तविक बिट स्कोर सीमा 0 होती है क्योंकि
HMMER कैसे काम करता है इसका विवरण। HMMER को कम से कम एक पास की आवश्यकता होती है
प्रति अनुक्रम मुख्य मॉडल; एक से अधिक पास (एक से अधिक डोमेन) करने के लिए
मल्टीडोमेन संरेखण का स्कोर एकल डोमेन संरेखण से बेहतर होना चाहिए,
और इसलिए अतिरिक्त डोमेन को सकारात्मक स्कोर में योगदान देना चाहिए। उपयोगकर्ता मार्गदर्शिका देखें
अधिक विस्तार के लिए।
--आगे
प्रति निर्धारित करने के लिए विटर्बी एल्गोरिदम के बजाय फॉरवर्ड एल्गोरिदम का उपयोग करें-
अनुक्रम स्कोर. प्रति-डोमेन स्कोर अभी भी विटर्बी एल्गोरिदम द्वारा निर्धारित किया जाता है।
कुछ लोगों ने तर्क दिया है कि रिमोट का पता लगाने के लिए फॉरवर्ड एक अधिक संवेदनशील एल्गोरिदम है
अनुक्रम समरूपताएँ; हालाँकि, HMMER के साथ मेरे प्रयोगों ने इसकी पुष्टि नहीं की है।
--सूचना
दावा करें कि इनपुट सेक्फ़ाइल प्रारूप में है ; बेबेलफ़िश प्रारूप न चलाएं
स्वतःनिर्णय. इससे प्रोग्राम की विश्वसनीयता कुछ हद तक बढ़ जाती है, क्योंकि
बेबेलफिश गलतियाँ कर सकती है; विशेष रूप से अप्राप्य, उच्च- के लिए अनुशंसित
HMMER का थ्रूपुट रन। मान्य प्रारूप स्ट्रिंग्स में FASTA, GENBANK, EMBL, GCG, शामिल हैं
पीआईआर, स्टॉकहोम, सेलेक्स, एमएसएफ, क्लस्टल और फिलिप। के लिए उपयोगकर्ता मार्गदर्शिका देखें
पूरी लिस्ट।
--शून्य2
पोस्ट हॉक दूसरा नल मॉडल बंद करें। डिफ़ॉल्ट रूप से, प्रत्येक संरेखण को पुनः प्राप्त किया जाता है
एक पोस्टप्रोसेसिंग चरण जो किसी भी संभावित पक्षपाती संरचना को ध्यान में रखता है
एचएमएम या लक्ष्य अनुक्रम। डेटाबेस खोजों में यह लगभग आवश्यक है,
विशेषकर स्थानीय संरेखण मॉडल के साथ। इसकी संभावना बहुत कम है
पोस्टप्रोसेसिंग वास्तविक मिलानों को हटा सकती है, और इन मामलों में --शून्य2 सुधार हो सकता है
पक्षपाती रचना देकर विशिष्टता को कम करने की कीमत पर संवेदनशीलता
के माध्यम से हिट करता है.
--पीवीएम समानांतर वर्चुअल मशीन (PVM) पर चलाएँ। PVM पहले से ही चल रहा होगा.
ग्राहक कार्यक्रम hmm2pfam-pvm सभी पीवीएम नोड्स पर स्थापित होना चाहिए। हम्म
डेटाबेस हम्मफाइल और एक संबद्ध जीएसआई इंडेक्स फ़ाइल हम्मफ़ाइल.जीएसआई भी होना चाहिए
सभी पीवीएम नोड्स पर स्थापित। (जीएसआई इंडेक्स प्रोग्राम द्वारा तैयार किया जाता है
हम्म2सूचकांक.) क्योंकि पीवीएम कार्यान्वयन I/O बाध्य है, इसलिए इसकी अत्यधिक अनुशंसा की जाती है
प्रत्येक नोड की एक स्थानीय प्रति होती है हम्मफाइल एनएफएस द्वारा साझा प्रतिलिपि स्थापित करने के बजाय।
वैकल्पिक PVM समर्थन को HMMER में संकलित किया जाना चाहिए --पीवीएम कार्य करना।
--xnu लक्ष्य प्रोटीन अनुक्रमों की XNU फ़िल्टरिंग चालू करें। न्यूक्लिक एसिड पर कोई प्रभाव नहीं पड़ता
क्रम. परीक्षण प्रयोगों में, --xnu की तुलना में कम अच्छा प्रदर्शन करता प्रतीत होता है
डिफ़ॉल्ट पोस्ट हॉक null2 मॉडल।
onworks.net सेवाओं का उपयोग करके hmm2pfam का ऑनलाइन उपयोग करें