अंग्रेज़ीफ्रेंचस्पेनिश

Ad


ऑनवर्क्स फ़ेविकॉन

हम्म्सिम - क्लाउड में ऑनलाइन

उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर पर ऑनवर्क्स मुफ्त होस्टिंग प्रदाता में हम्मसिम चलाएं

यह कमांड हम्मसिम है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।

कार्यक्रम:

नाम


हम्मसिम - यादृच्छिक अनुक्रमों पर स्कोर वितरण एकत्र करें

SYNOPSIS


हम्सिम [विकल्प]

वर्णन


RSI हम्सिम प्रोग्राम यादृच्छिक अनुक्रम उत्पन्न करता है, उन्हें मॉडल के साथ स्कोर करता है ,
और परिणाम के लिए विभिन्न प्रकार के हिस्टोग्राम, प्लॉट और फिट किए गए वितरण को आउटपुट करता है
स्कोर।

हम्सिम HMMER पैकेज का मुख्य धारा हिस्सा नहीं है। अधिकांश उपयोगकर्ताओं के पास इसका कोई कारण नहीं होगा
इसका इस्तेमाल करें। इसका उपयोग पी-वैल्यू निर्धारित करने के लिए उपयोग की जाने वाली सांख्यिकीय विधियों को विकसित करने और परीक्षण करने के लिए किया जाता है
और HMMER3 में ई-मान। उदाहरण के लिए, इसका उपयोग 2008 में अधिकांश परिणाम उत्पन्न करने के लिए किया गया था
H3 के स्थानीय संरेखण आँकड़ों पर पेपर (PLoS Comp Bio 4:e1000069, 2008;
http://www.ploscompbiol.org/doi/pcbi.1000069).

चूँकि यह एक शोध परीक्षण है, इसलिए आपको यह अपेक्षा नहीं करनी चाहिए कि यह अन्य की तरह मजबूत होगा
पैकेज में प्रोग्राम. उदाहरण के लिए, विकल्प अजीब तरीकों से बातचीत कर सकते हैं; हमने नहीं किया
सभी विभिन्न संभावित संयोजनों का परीक्षण किया गया और न ही पूर्वानुमान लगाने की कोशिश की गई।

मुख्य कार्य अधिकतम संभावना गम्बेल वितरण को विटरबी स्कोर या ए में फिट करना है
उच्च स्कोरिंग फॉरवर्ड स्कोर के लिए अधिकतम संभावना घातीय पूंछ, और इनका परीक्षण करना
फिट किए गए वितरण इस अनुमान का पालन करते हैं कि विटर्बी गम्बेल दोनों के लिए लैम्ब्डा ~ लॉग_2
और फॉरवर्ड एक्सपोनेंशियल टेल।

आउटपुट संख्याओं की एक तालिका है, प्रत्येक मॉडल के लिए एक पंक्ति। चार अलग-अलग पैरामीट्रिक फिट
स्कोर डेटा का परीक्षण किया जाता है: (1) अधिकतम संभावना दोनों स्थानों (एमयू/ताउ) और के लिए फिट बैठती है
ढलान (लैम्ब्डा) पैरामीटर; (2) लैम्ब्डा=लॉग_2 मानते हुए, अधिकतम संभावना फिट बैठती है
केवल स्थान पैरामीटर; (3) वही लेकिन करंट का उपयोग करते हुए एक किनारे-सही लैम्ब्डा मान लिया गया
H3 में प्रक्रियाएँ [एड्डी, 2008]; और (4) एच3 के करंट द्वारा निर्धारित दोनों मापदंडों का उपयोग करना
प्रक्रियाएं. अच्छाई-की-फिट के लिए मानक सरल, त्वरित और गंदा आँकड़ा 'ई@10' है,
10वीं रैंकिंग वाले शीर्ष हिट का परिकलित ई-मूल्य, जिसकी हमें लगभग 10 होने की उम्मीद है।

विस्तार से, आउटपुट के कॉलम हैं:

नाम मॉडल का नाम.

टेलप वितरण को फिट करने के लिए उच्चतम अंकों के अंश का उपयोग किया जाता है। विटर्बी, एमएसवी, और के लिए
हाइब्रिड स्कोर, यह डिफॉल्ट 1.0 है (एक गम्बेल वितरण सभी के लिए फिट किया गया है
डेटा)। फॉरवर्ड स्कोर के लिए, यह डिफ़ॉल्ट 0.02 है (एक घातीय पूंछ फिट की गई है)।
उच्चतम 2% स्कोर)।

म्यू/ताऊ अधिकतम संभावना के लिए स्थान पैरामीटर डेटा के लिए उपयुक्त है।

लैम्ब्डा अधिकतम संभावना के लिए ढलान पैरामीटर डेटा के लिए उपयुक्त है।

ई@10 एमएल म्यू/ताउ का उपयोग करके 10वें रैंक वाले उच्च स्कोर ('ई@10') के लिए ई-मूल्य की गणना की गई
और लैम्ब्डा. परिभाषा के अनुसार, यदि ई-मूल्य का अनुमान लगाया जाए तो यह लगभग 10 होने की उम्मीद है
सटीक।

mufix अधिकतम संभावना के लिए स्थान पैरामीटर, ज्ञात (निश्चित) ढलान के साथ फिट बैठता है
log_2 (0.693) का पैरामीटर लैम्ब्डा।

ई@10फिक्स
म्यूफ़िक्स और अपेक्षित का उपयोग करके 10वें रैंक वाले स्कोर के लिए ई-मूल्य की गणना की गई
लैम्ब्डा = लॉग_2 = 0.693.

mufix2 अधिकतम संभावना के लिए स्थान पैरामीटर, किनारे-प्रभाव-सही के साथ फिट बैठता है
लैम्ब्डा.

E@10fix2
म्यूफ़िक्स10 और एज-इफ़ेक्ट का उपयोग करके 2वें रैंक वाले स्कोर के लिए ई-मूल्य की गणना की गई-
लैम्ब्डा को ठीक किया गया।

पीएमयू H3 की अनुमान प्रक्रियाओं द्वारा निर्धारित स्थान पैरामीटर।

प्लाम्ब्डा
H3 की अनुमान प्रक्रियाओं द्वारा निर्धारित ढलान पैरामीटर।

pE@10 पीएमयू, प्लाम्ब्डा का उपयोग करके 10वें रैंक वाले स्कोर के लिए ई-वैल्यू की गणना की गई।

इस तालिका के अंत में, एक और पंक्ति मुद्रित होती है, जो # से शुरू होती है और इसका सारांश देती है
सिमुलेशन द्वारा उपयोग किया गया कुल सीपीयू समय।

कुछ वैकल्पिक आउटपुट फ़ाइलें xmgrace xy प्रारूप में हैं। एक्सएमग्रेस शक्तिशाली और स्वतंत्र है
उपलब्ध ग्राफ़-प्लॉटिंग सॉफ़्टवेयर।

कई तरह का विकल्प


-h मदद; कमांड लाइन उपयोग और सभी उपलब्ध विकल्पों का एक संक्षिप्त अनुस्मारक प्रिंट करें।

-a प्रत्येक सिम्युलेटेड अनुक्रम से अपेक्षित विटर्बी संरेखण लंबाई आँकड़े एकत्र करें।
यह केवल विटर्बी स्कोर (डिफ़ॉल्ट; देखें) के साथ काम करता है --विट). दो अतिरिक्त
फ़ील्ड प्रत्येक मॉडल के लिए आउटपुट तालिका में मुद्रित होती हैं: विटरबी की औसत लंबाई
संरेखण, और मानक विचलन।

-v (शब्दशः)। अंक भी प्रिंट करें, प्रति पंक्ति एक अंक।

-L बेतरतीब ढंग से नमूना किए गए (गैर-समरूप) अनुक्रमों की लंबाई निर्धारित करें
डिफ़ॉल्ट 100 है।

-N बेतरतीब ढंग से नमूना अनुक्रमों की संख्या निर्धारित करें . डिफ़ॉल्ट 1000 है।

--एमपीआई के अंतर्गत MPI समानांतर मोड में चलाएँ mpirun. इसे भेजने के स्तर पर समानान्तर किया गया है
एमपीआई कार्यकर्ता प्रक्रिया के लिए एक समय में एक प्रोफ़ाइल, इसलिए समानांतरीकरण केवल तभी मदद करता है
आपकी एक से अधिक प्रोफ़ाइल हैं , और आप कम से कम ऐसा चाहते हैं
एमपीआई कार्यकर्ता प्रक्रियाओं के रूप में कई प्रोफ़ाइल। (केवल तभी उपलब्ध है जब वैकल्पिक एमपीआई समर्थन हो
संकलन-समय पर सक्षम।)

विकल्प नियंत्रित आउटपुट


-o मुख्य आउटपुट तालिका को एक फ़ाइल में सहेजें इसे stdout पर भेजने के बजाय।

--एक फ़ाइल
विटर्बी संरेखण आँकड़े एकत्र करते समय (द -a विकल्प), प्रत्येक नमूने के लिए
अनुक्रम, एक फ़ाइल में प्रति पंक्ति दो फ़ील्ड आउटपुट करें : इष्टतम की लंबाई
संरेखण, और विटर्बी बिट स्कोर। आवश्यकता है कि -a विकल्प का भी प्रयोग किया जाता है।

--efile
फ़ाइल में XMGRACE xy प्रारूप में रैंक बनाम ई-वैल्यू प्लॉट आउटपुट करें . x-अक्ष है
इस क्रम की रैंक, उच्चतम स्कोर से निम्नतम तक; y-अक्ष E-मान है
इस क्रम के लिए गणना की गई. ई-मानों की गणना H3 की डिफ़ॉल्ट प्रक्रियाओं का उपयोग करके की जाती है
(यानी आउटपुट तालिका में पीएमयू, प्लाम्ब्डा पैरामीटर)। आप एक कठिन मुकाबले की उम्मीद करते हैं
यदि ई-मूल्यों का सटीक अनुमान लगाया गया है तो रैंक और ई-मूल्य के बीच।

--फाइल
एक "फ़िल्टर पावर" फ़ाइल को आउटपुट करें : प्रत्येक मॉडल के लिए, तीन फ़ील्ड वाली एक पंक्ति:
मॉडल का नाम, पी-वैल्यू सीमा पार करने वाले अनुक्रमों की संख्या, और का अंश
पी-वैल्यू सीमा पार करने वाले अनुक्रम। देखना --प्थ्रेश पी-वैल्यू सेट करने के लिए
थ्रेशोल्ड, जो डिफ़ॉल्ट रूप से 0.02 (H3 में डिफ़ॉल्ट MSV फ़िल्टर थ्रेशोल्ड) है। पी-
मान H3 की डिफ़ॉल्ट प्रक्रियाओं (pmu, plambda पैरामीटर) द्वारा निर्धारित होते हैं
आउटपुट तालिका)। यदि सब कुछ ठीक है, तो आप फ़िल्टर शक्ति के बराबर देखने की उम्मीद करते हैं
सीमा की अनुमानित पी-वैल्यू सेटिंग।

--pफ़ाइल
फाइल करने के लिए आउटपुट संचयी उत्तरजीविता प्लॉट (P(S>x))। XMGRACE xy प्रारूप में। वहाँ
तीन प्लॉट हैं: (1) प्रेक्षित स्कोर वितरण; (2) अधिकतम संभावना
सज्जित वितरण; (3) स्थान पैरामीटर के लिए उपयुक्त अधिकतम संभावना
(म्यू/ताऊ) जबकि
लैम्ब्डा=लॉग_2 मानकर।

--xफ़ाइल
बिट स्कोर को डबल-प्रिसिजन फ्लोट्स (8 बाइट्स प्रति) के बाइनरी सरणी के रूप में आउटपुट करें
स्कोर) फाइल करने के लिए . ईज़ल जैसे कार्यक्रम ईएसएल-हिस्टप्लॉट ऐसी बाइनरी फ़ाइलें पढ़ सकते हैं.
अत्यधिक बड़े नमूना आकार उत्पन्न करते समय यह उपयोगी होता है।

विकल्प नियंत्रित आदर्श विन्यास (मोड)


H3 केवल मल्टीहिट स्थानीय संरेखण का उपयोग करता है ( --fs मोड), और यहीं पर हम विश्वास करते हैं
सांख्यिकीय फिट बैठता है. यूनीहिट स्थानीय संरेखण स्कोर (स्मिथ/वाटरमैन; --दप मोड) भी हमारा पालन करें
सांख्यिकीय अनुमान. ग्लोकल संरेखण आँकड़े (या तो मल्टीहिट या यूनीहिट) हैं
अभी भी पर्याप्त रूप से समझा नहीं गया है और न ही पर्याप्त रूप से फिट किया गया है।

--fs मल्टीहिट स्थानीय संरेखण स्कोर एकत्र करें। यह डिफ़ॉल्ट है. संरेखण के रूप में
'खंड खोज मोड'।

--दप यूनीहिट स्थानीय संरेखण स्कोर एकत्र करें। H3J स्थिति अक्षम है. संरेखण के रूप में
'स्मिथ/वाटरमैन खोज मोड'।

--ls मल्टीहिट ग्लोकल अलाइनमेंट स्कोर एकत्र करें। ग्लोकल (वैश्विक/स्थानीय) संरेखण में,
संपूर्ण मॉडल को लक्ष्य के अनुक्रम के अनुरूप होना चाहिए। H3 स्थानीय प्रवेश/निकास
संक्रमण संभावनाएँ अक्षम हैं. 'ls' HMMER2 के ऐतिहासिक से आता है
मल्टीहिट स्थानीय संरेखण के लिए 'स्थानीय खोज मोड' के रूप में शब्दावली।

--एस यूनीहिट ग्लोकल एलाइनमेंट स्कोर एकत्र करें। H3J स्थिति और स्थानीय प्रवेश/निकास दोनों
संक्रमण संभावनाएँ अक्षम हैं. 's' HMMER2 के ऐतिहासिक से आता है
यूनीहिट ग्लोकल संरेखण के लिए शब्दावली।

विकल्प नियंत्रित स्कोरिंग कलन विधि


--विट विटरबी अधिकतम संभावना संरेखण स्कोर एकत्र करें। यह डिफ़ॉल्ट है.

--fwd अग्रेषित लॉग-ऑड्स संभावना स्कोर एकत्र करें, संरेखण समूह पर संक्षेपित करें।

--हाइब 'हाइब्रिड' स्कोर एकत्र करें, जैसा कि यू और ह्वा द्वारा पत्रों में वर्णित है (उदाहरण के लिए,
जैव सूचना विज्ञान 18:864, 2002)। इनमें फॉरवर्ड मैट्रिक्स की गणना करना और लेना शामिल है
अधिकतम सेल मान. यह संख्या स्वयं सांख्यिकीय रूप से कुछ हद तक प्रेरित नहीं है,
लेकिन वितरण एक अच्छा व्यवहार वाला चरम मूल्य वितरण होने की उम्मीद है
(गुम्बेल)।

--एमएसवी H3 के मुख्य का उपयोग करके MSV (मल्टीपल अनगैप्ड सेगमेंट विटरबी) स्कोर एकत्र करें
त्वरण अनुमानी.

--तेज़ उपरोक्त विकल्पों में से किसी के लिए, H3 के अनुकूलित उत्पादन कार्यान्वयन का उपयोग करें
SIMD वैश्वीकरण)। डिफ़ॉल्ट रूप से कार्यान्वयन का उपयोग एक छोटे से बलिदान के लिए किया जाता है
संख्यात्मक परिशुद्धता की मात्रा. इससे भ्रमित करने वाला शोर उत्पन्न हो सकता है
सांख्यिकीय सिमुलेशन और फिट, इसलिए जब कोई सटीक के बारे में अत्यधिक चिंतित हो जाता है
विवरण, शोर के उस स्रोत को दूर करने में सक्षम होना बेहतर है।

विकल्प नियंत्रित सज्जित पूंछ जनता के लिए आगे


कुछ प्रयोगों में, फॉरवर्ड स्कोर को अलग-अलग टेल की रेंज में फिट करना उपयोगी था
केवल एक के बजाय जनसमूह। ये विकल्प समान रूप से फिट करने के लिए एक तंत्र प्रदान करते हैं-
विभिन्न पूँछ द्रव्यमानों की दूरी वाली सीमा। प्रत्येक भिन्न पूंछ द्रव्यमान के लिए, एक रेखा उत्पन्न होती है
आउटपुट में।

--tmin
पूंछ द्रव्यमान वितरण पर निचली सीमा निर्धारित करें। (डिफ़ॉल्ट 0.02 है
डिफ़ॉल्ट एकल पूंछ द्रव्यमान।)

--tmax
पूंछ द्रव्यमान वितरण पर ऊपरी सीमा निर्धारित करें। (डिफ़ॉल्ट 0.02 है
डिफ़ॉल्ट एकल पूंछ द्रव्यमान।)

--tpoints
से शुरू करके, नमूना लेने के लिए पूंछ द्रव्यमान की संख्या निर्धारित करें --tmin और अंत में --tmax.
(डिफ़ॉल्ट 1 सिंगल टेल मास के लिए डिफ़ॉल्ट 0.02 है।)

--tरैखिक
समान रैखिक रिक्ति के साथ पूंछ द्रव्यमान की एक श्रृंखला का नमूना लें। डिफ़ॉल्ट का उपयोग करना है
एकसमान लघुगणकीय रिक्ति.

विकल्प नियंत्रित H3 पैरामीटर अनुमान लगाना विधि


H3 स्थान मापदंडों का अनुमान लगाने के लिए तीन लघु यादृच्छिक अनुक्रम सिमुलेशन का उपयोग करता है
एमएसवी स्कोर, विटरबी स्कोर और फॉरवर्ड स्कोर के लिए अपेक्षित स्कोर वितरण। इन
विकल्प इन सिमुलेशन को संशोधित करने की अनुमति देते हैं।

--ईएमएल
सिमुलेशन में अनुक्रम लंबाई सेट करता है जो स्थान पैरामीटर mu for . का अनुमान लगाता है
एमएसवी ई-मूल्य। डिफ़ॉल्ट 200 है.

--ईएमएन
सिमुलेशन में अनुक्रमों की संख्या सेट करता है जो स्थान पैरामीटर का अनुमान लगाता है mu
MSV ई-मूल्यों के लिए। डिफ़ॉल्ट 200 है.

--ईवीएल
सिमुलेशन में अनुक्रम लंबाई सेट करता है जो स्थान पैरामीटर mu for . का अनुमान लगाता है
विटर्बी ई-मूल्य। डिफ़ॉल्ट 200 है.

--ईवीएन
सिमुलेशन में अनुक्रमों की संख्या सेट करता है जो स्थान पैरामीटर का अनुमान लगाता है mu
विटर्बी ई-मूल्यों के लिए। डिफ़ॉल्ट 200 है.

--ईएफएल
सिमुलेशन में अनुक्रम लंबाई सेट करता है जो स्थान पैरामीटर ताऊ का अनुमान लगाता है
फॉरवर्ड ई-वैल्यू के लिए। डिफ़ॉल्ट 100 है।

--ईएफएन
सिमुलेशन में अनुक्रमों की संख्या सेट करता है जो स्थान पैरामीटर का अनुमान लगाता है
फॉरवर्ड ई-वैल्यू के लिए ताऊ। डिफ़ॉल्ट 200 है।

--इफ्ट
स्थान का अनुमान लगाने वाले सिमुलेशन में फ़िट होने के लिए टेल मास फ़्रैक्शन सेट करता है
फॉरवर्ड मूल्यांकन के लिए पैरामीटर ताऊ। डिफ़ॉल्ट 0.04 है।

डिबगिंग विकल्प


--स्टाल
MPI मास्टर/वर्कर संस्करण को डीबग करने के लिए: प्रारंभ करने के बाद रोकें, सक्षम करने के लिए
डिबगर्स को चल रहे मास्टर और वर्कर (ओं) प्रक्रियाओं में संलग्न करने के लिए डेवलपर। भेजना
विराम जारी करने के लिए SIGCONT संकेत। (जीडीबी के तहत: (GDB) संकेत सिगकॉन्ट) (केवल
उपलब्ध है यदि वैकल्पिक MPI समर्थन संकलन-समय पर सक्षम किया गया था।)

--बीज
यादृच्छिक संख्या बीज को पर सेट करें . डिफ़ॉल्ट 0 है, जो यादृच्छिक संख्या बनाता है
जनरेटर एक मनमाना बीज का उपयोग करता है, ताकि अलग-अलग रन हो सकें हम्सिम लगभग होगा
निश्चित रूप से एक अलग सांख्यिकीय नमूना तैयार करें। डिबगिंग के लिए, यह उपयोगी है
एक यादृच्छिक संख्या बीज को ठीक करके, प्रतिलिपि प्रस्तुत करने योग्य परिणामों को बाध्य करें।

प्रायोगिक विकल्प


इन विकल्पों का उपयोग छोटे-छोटे विभिन्न खोजपूर्ण प्रयोगों में किया गया।

--बीजीफ्लैट
दोनों के लिए, पृष्ठभूमि अवशेष वितरण को एक समान वितरण पर सेट करें
स्कोर की गणना करने और उत्पन्न करने के लिए उपयोग किए जाने वाले शून्य मॉडल के उद्देश्य
यादृच्छिक अनुक्रम. डिफ़ॉल्ट मानक अमीनो एसिड पृष्ठभूमि आवृत्ति का उपयोग करना है
वितरण.

--बीजीकॉम्प
पृष्ठभूमि अवशेष वितरण को प्रोफ़ाइल की औसत संरचना पर सेट करें।
इसका उपयोग पक्षपातपूर्ण रचना के कुछ प्रभावों की खोज में किया गया था।

--x-नो-लेंथमॉडल
H3 लक्ष्य अनुक्रम लंबाई मॉडल को बंद करें। एन,सी,जे के लिए स्व-संक्रमण सेट करें
और इसके बजाय शून्य मॉडल को 350/351 पर; यह HMMER2 का अनुकरण करता है। में कोई अच्छा विचार नहीं है
सामान्य। इसका उपयोग मुख्य H2 बनाम H3 अंतरों में से एक को प्रदर्शित करने के लिए किया गया था।

--नु
MSV एल्गोरिथम के लिए nu पैरामीटर सेट करें - अनगैप्ड लोकल की अपेक्षित संख्या
लक्ष्य अनुक्रम के अनुसार संरेखण। डिफ़ॉल्ट 2.0 है, जो E->J के अनुरूप है
0.5 की संक्रमण संभावना. इसका उपयोग यह परीक्षण करने के लिए किया गया था कि क्या अलग-अलग एनयू है
परिणाम पर महत्वपूर्ण प्रभाव (यह उचित प्रतीत नहीं होता है)। यह विकल्प केवल
अगर काम करता है --एमएसवी चयनित है (यह केवल MSV को प्रभावित करता है), और यह इसके साथ काम नहीं करेगा --तेज़
(क्योंकि अनुकूलित कार्यान्वयन nu=2.0 मानने के लिए हार्डवायर्ड हैं)।

--प्थ्रेश
फ़िल्टर पावर फ़ाइलों को जेनरेट करने में उपयोग करने के लिए फ़िल्टर पी-वैल्यू थ्रेशोल्ड सेट करें
--फाइल. डिफ़ॉल्ट 0.02 है (जो एमएसवी स्कोर के परीक्षण के लिए उपयुक्त होगा,
चूँकि यह H3 की त्वरण पाइपलाइन में डिफ़ॉल्ट MSV फ़िल्टर सीमा है।)
अन्य उपयुक्त विकल्प (त्वरण पाइपलाइन में मिलान डिफ़ॉल्ट) होंगे
विटरबी के लिए 0.001, और फॉरवर्ड के लिए 1e-5।

onworks.net सेवाओं का उपयोग करके ऑनलाइन hmmsim का उपयोग करें


फ्री सर्वर और वर्कस्टेशन

विंडोज और लाइनेक्स एप डाउनलोड करें

लिनक्स कमांड

Ad