यह कमांड cdhit-454 है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
सीडी-हिट-454 - त्वरित समूह अनुक्रम, 454 डेटा के लिए अनुकूलित
SYNOPSIS
सीडीएचआईटी-454 [ऑप्शंस]
वर्णन
====== सीडी-हिट संस्करण 4.6 (23 जनवरी 2016 को निर्मित) ======
ऑप्शंस
-i फास्टा प्रारूप में फ़ाइल नाम इनपुट करना आवश्यक है
-o आउटपुट फ़ाइल नाम, आवश्यक
-c अनुक्रम पहचान सीमा, डिफ़ॉल्ट 0.98 यह एक "वैश्विक अनुक्रम पहचान" है
गणना इस प्रकार की जाती है: संरेखण में समान अमीनो एसिड की संख्या को पूर्ण से विभाजित किया जाता है
छोटे अनुक्रम की लंबाई + अंतराल
-b संरेखण की बैंड_विड्थ, डिफ़ॉल्ट 10
-M प्रोग्राम के लिए मेमोरी सीमा (एमबी में), डिफ़ॉल्ट 800; असीमित के लिए 0;
-T धागों की संख्या, डिफ़ॉल्ट 1; 0 के साथ, सभी सीपीयू का उपयोग किया जाएगा
-n शब्द_लंबाई, डिफ़ॉल्ट 10, इसे चुनने के लिए उपयोगकर्ता की मार्गदर्शिका देखें
अल लंबे अनुक्रम के लिए संरेखण कवरेज, डिफ़ॉल्ट 0.0 यदि 0.9 पर सेट किया गया है
संरेखण में अनुक्रम का 90% शामिल होना चाहिए
अल लंबे अनुक्रम के लिए संरेखण कवरेज नियंत्रण, डिफ़ॉल्ट 99999999 यदि 60 पर सेट है,
और अनुक्रम की लंबाई 400 है, तो संरेखण >=340 (400-60) होना चाहिए
अवशेष
-जैसा छोटे अनुक्रम के लिए संरेखण कवरेज, डिफ़ॉल्ट 0.0 यदि 0.9 पर सेट किया गया है
संरेखण में अनुक्रम का 90% शामिल होना चाहिए
-जैसा छोटे अनुक्रम के लिए संरेखण कवरेज नियंत्रण, डिफ़ॉल्ट 99999999 यदि 60 पर सेट है,
और अनुक्रम की लंबाई 400 है, तो संरेखण >=340 (400-60) होना चाहिए
अवशेष
-B 1 या 0, डिफ़ॉल्ट 0, यदि 1, अनुक्रम पर सेट किया जाता है, तो डिफ़ॉल्ट रूप से अनुक्रम रैम में संग्रहीत होते हैं
हार्ड ड्राइव पर संग्रहीत हैं, इसका उपयोग करने की अनुशंसा की जाती है -B विशाल डेटाबेस के लिए 1
-g 1 या 0, सीडी-हिट के डिफ़ॉल्ट एल्गोरिदम द्वारा डिफ़ॉल्ट 0, एक अनुक्रम को क्लस्टर किया जाता है
पहला क्लस्टर जो थ्रेशोल्ड (फास्ट क्लस्टर) को पूरा करता है। यदि 1 पर सेट किया जाए तो प्रोग्राम चालू हो जाएगा
इसे सबसे समान क्लस्टर में क्लस्टर करें जो सीमा को पूरा करता है (सटीक लेकिन धीमा)।
मोड) लेकिन 1 या 0 अंतिम क्लस्टर के प्रतिनिधियों को नहीं बदलेगा
-D अधिकतम आकार प्रति इंडेल, डिफ़ॉल्ट 1
मैच मिलान स्कोर, डिफ़ॉल्ट 2
बेमेल
बेमेल स्कोर, डिफ़ॉल्ट -1
-अंतर गैप ओपनिंग स्कोर, डिफ़ॉल्ट -3
-अंतराल-विस्तार
गैप एक्सटेंशन स्कोर, डिफ़ॉल्ट -1
-बक बैकअप क्लस्टर फ़ाइल लिखें (1 या 0, डिफ़ॉल्ट 0)
-h इस सहायता को प्रिंट करें
प्रश्न, बग, Weizhong Li से संपर्क करें [ईमेल संरक्षित]
यदि आपको सीडी-हिट उपयोगी लगता है, तो कृपया उद्धृत करें:
"बड़े प्रोटीन के आकार को कम करने के लिए अत्यधिक समरूप अनुक्रमों का क्लस्टरिंग
डेटाबेस", वेइज़होंग ली, लुकाज़ जारोस्ज़वेस्की और एडम गॉडज़िक। जैव सूचना विज्ञान, (2001)
17:282-283 "सीडी-हिट: क्लस्टरिंग और बड़े सेटों की तुलना करने के लिए एक तेज़ कार्यक्रम
प्रोटीन या न्यूक्लियोटाइड अनुक्रम", वेइज़होंग ली और एडम गॉडज़िक। जैव सूचना विज्ञान, (2006)
22:1658-1659 "बीफांग नीउ, लिमिन फू, शुलेई सन और वेइज़होंग ली। कृत्रिम और
पायरोसेक्वेंसिंग में प्राकृतिक डुप्लिकेट मेटागेनोमिक डेटा को पढ़ता है। बीएमसी जैव सूचना विज्ञान
(१९२०) ५:३०
onworks.net सेवाओं का उपयोग करके cdhit-454 का ऑनलाइन उपयोग करें