यह कमांड मिनीस्म है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
मिनीस्म - लंबे समय तक पढ़े जाने वाले अनुक्रमों के लिए डे नोवो असेंबलर
SYNOPSIS
लघुवाद [-बी12वी] [-m मिनमैच] [-i मिनीडेन] [-s न्यूनतम अवधि] [-c minCov] [-o minOvlp] [-h
मैक्सहैंग] [-I intThres] [-g मैक्सगैपडिफ़] [-d maxBubDist] [-e minUtgSize] [-f फ़ाइल पढ़ें] [-n
एनराउंड्स] [-r ड्रॉपरेशियो] [-F अंतिम ड्रॉप अनुपात] [-p आउटपुटइन्फो] मैपिंग.paf > आउटपुट.जीएफए
वर्णन
मिनीस्म एक बहुत तेज़ ओएलसी-आधारित डे नोवो असेंबलर है जो लंबे समय तक शोर-शराबे के साथ पढ़ा जाता है। यह सब-बनाम- लेता है
सभी पीएएफ प्रारूप में सेल्फ-मैपिंग को इनपुट के रूप में पढ़ते हैं और जीएफए में एक असेंबली ग्राफ को आउटपुट करते हैं
प्रारूप। मुख्यधारा के असेंबलरों से अलग, मिनीस्म में सर्वसम्मति वाला कदम नहीं होता है। यह
अंतिम यूनिटीग अनुक्रम उत्पन्न करने के लिए बस पढ़े गए अनुक्रमों के टुकड़ों को जोड़ता है। इस प्रकार
प्रति-आधार त्रुटि दर कच्चे इनपुट रीड्स के समान है।
विकल्प
प्रारंभिक चुनाव विकल्पों
-m INT से कम होने वाली ड्रॉप मैपिंग INT मिलान आधार (पीएएफ में कॉलम10) [100]। यह
विकल्प की भी वही भूमिका है -L मिनिमैप का.
-s INT से छोटी मैपिंग ड्रॉप करें INT-बीपी [1000]। यह विकल्प दूसरे को भी प्रभावित करता है
रीड फ़िल्टरिंग का दौर और न्यूनतम ओवरलैप लंबाई।
-i फ्लोट रीड फ़िल्टरिंग के दौरान, नीचे दिए गए col10/col11 के साथ मैपिंग को अनदेखा करें फ्लोट [0.05]
उपेक्षित मैपिंग का उपयोग अभी भी रीड ओवरलैप के लिए किया जाता है।
-c INT अन्य पाठों द्वारा न्यूनतम कवरेज [3]। फ़िल्टरिंग के पहले दौर में, लघुवाद
द्वारा कवर किया गया सबसे लंबा क्षेत्र ढूँढता है INT या अधिक पढ़ता है. दूसरे दौर में, यह
इसके अतिरिक्त प्रत्येक शेष आधार को कवर करने की आवश्यकता होती है INT कम से कम आधार
न्यूनतम अवधि/2 अन्य पाठों के अंत से।
ओवरलैपिंग विकल्पों
-o INT न्यूनतम ओवरलैप लंबाई [समान न्यूनतम अवधि]
-h INT अधिकतम ओवरहैंग लंबाई [1000]। ओवरहांग एक अनमैप्ड क्षेत्र है जो होना चाहिए
वास्तविक ओवरलैप या वास्तविक रोकथाम को देखते हुए मैप किया गया। यदि ओवरहैंग बहुत लंबा है,
मैपिंग को आंतरिक मिलान माना जाएगा और इसे नज़रअंदाज कर दिया जाएगा।
-I फ्लोट मैपिंग के लिए मैपिंग लंबाई और मैपिंग+ओवरहैंग लंबाई का न्यूनतम अनुपात
एक रोकथाम या ओवरलैप माना जाता है [0.8]। इस विकल्प की भी ऐसी ही भूमिका है
-h, सिवाय इसके कि यह अनुपात को नियंत्रित करता है, लंबाई को नहीं।
ग्राफ ख़ाका विकल्पों
-g INT मैपिंग में दो रीड्स के बीच अधिकतम अंतर अंतर [1000]। यह पैरामीटर है
केवल संक्रमणीय कमी के लिए उपयोग किया जाता है।
-d INT बुलबुला फूटने के लिए अधिकतम जांच दूरी [50000]। से अधिक लंबे बुलबुले INT
पॉप नहीं किया जाएगा.
-e INT एक यूनिटिग को छोटा माना जाता है यदि वह इससे कम से बना हो INT [4] पढ़ता है।
लघुवाद विभिन्न चरणों में छोटी इकाइयों को हटाने का प्रयास कर सकता है।
-f फ़ाइल यूनिटीग अनुक्रम उत्पन्न करने के लिए FASTA या FASTQ प्रारूप में अनुक्रम फ़ाइल पढ़ें
[व्यर्थ]। यदि यह विकल्प अनुपस्थित है, तो मिनीस्म बिना GFA आउटपुट उत्पन्न करता है
दृश्यों।
-r फ्लोट1,[फ्लोट2]
अधिकतम और न्यूनतम ओवरलैप ड्रॉप अनुपात [0.7,0.5]। मान लीजिए कि ओवरलैप(v->w) ओवरलैप है
किनारे की लंबाई v->w और maxovlp(v)=max_w{overlap(v->w)} सबसे बड़ी लंबाई होगी
ओवरलैप. यदि ओवरलैप(v->w)/maxovlp(v) a से नीचे है तो मिनीस्म ओवरलैप v->w को गिरा देता है
सीमा इस विकल्प द्वारा नियंत्रित होती है। लघुवाद लागू होता है एनराउंड्स लघु दौर
बीच में बढ़ती सीमा के साथ ओवरलैप हटाना फ्लोट1 और फ्लोट2.
-n INT छोटे ओवरलैप हटाने के दौर [3]।
-F फ्लोट शॉर्ट यूनिटिग हटाने के बाद ओवरलैप ड्रॉप अनुपात सीमा [0.8]
कई तरह का विकल्पों
-b इंगित करें कि इनपुट में, एक ही मैपिंग दो बार दिए जाने की संभावना है
-1 प्री-असेंबली पठन चयन के पहले दौर को छोड़ें
-2 प्री-असेंबली पठन चयन के दूसरे दौर को छोड़ें
-p एसटीआर आउटपुट जानकारी और प्रारूप [ug]। संभव एसटीआर मूल्यों में शामिल हैं - बिस्तर: डाक-
BED प्रारूप में फ़िल्टर किए गए पठन क्षेत्र; पीएएफ: पोस्ट-फ़िल्टर के बीच मैपिंग
पढ़ता है; sg: जीएफए प्रारूप में ओवरलैप ग्राफ़ पढ़ें; ug: जीएफए में यूनिटिग ग्राफ
प्रारूप.
-V संस्करण संख्या को stdout पर प्रिंट करें
इनपुट FORMAT
मिनियास्म पेयरवाइज मैपिंग फॉर्मेट (पीएएफ) में मैपिंग पोजीशन को पढ़ता है, जो एक टैब है-
प्रत्येक पंक्ति के साथ सीमांकित पाठ प्रारूप जिसमें कम से कम 12 फ़ील्ड शामिल हैं, जैसा कि में वर्णित है
निम्न तालिका:
मैं मैं
│ज़ीन │ प्रकार │ Description │
मैं मैं
1 स्ट्रिंग क्वेरी अनुक्रम नाम
2 int क्वेरी अनुक्रम लंबाई │
3 │ int │ क्वेरी प्रारंभ निर्देशांक (0-आधारित)
4 │ int क्वेरी अंत निर्देशांक (0-आधारित)
5 │ चार │ `+' यदि एक ही स्ट्रैंड पर क्वेरी और लक्ष्य; `-' यदि विपरीत
6 स्ट्रिंग │ लक्ष्य अनुक्रम नाम
7 int │ लक्ष्य अनुक्रम लंबाई │
8 │ int │ लक्ष्य प्रारंभ करें मूल स्ट्रैंड पर समन्वय करें
│ 9 │ int लक्ष्य अंत मूल स्ट्रैंड पर समन्वय करता है
10 int मानचित्रण में मेल खाने वाले आधारों की संख्या
│ 11 │ int मानचित्रण में अंतराल सहित संख्या आधार,
12 int मैपिंग गुणवत्ता (0-255 के साथ 255 लापता के लिए)
मैं मैं
कृपया देखें मिनिमैप(1) प्रत्येक क्षेत्र के विस्तृत विवरण के लिए।
आउटपुट FORMAT
मिनीस्म असेंबली को ग्राफिकल फ्रैगमेंट असेंबली फॉर्मेट (जीएफए) में आउटपुट करता है। यह है एक
लाइन आधारित TAB-सीमांकित प्रारूप, अग्रणी अक्षर के साथ लाइन के प्रकार को इंगित करता है।
निम्न तालिका लघुवाद द्वारा प्रयुक्त लाइन प्रकार देती है:
┌─────┬─────────────┬────────────── ────────── ───────────────────────┐
│लाइन │ टिप्पणी │ फिक्स्ड फ़ील्ड्स │
├─────┼─────────────┼────────────── ────────── ───────────────────────┤
│ एच │ हेडर │ एन/ए │
│ एस │ सेगमेंट │ सेगनाम सेगसेक │
│ एल │ ओवरलैप │ segName1 segOri1 segName2 segOri2 ovlpCIGAR │
│ a │ स्वर्ण पथ │ utgName utgStart readName:start-end readOri length │
└─────┴─────────────┴────────────── ────────── ───────────────────────┘
onworks.net सेवाओं का उपयोग करके ऑनलाइन मिनीस्म का उपयोग करें