यह फास्टक्यूसी कमांड है जिसे उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर जैसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशनों में से एक का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
FastQC - उच्च थ्रूपुट अनुक्रम QC विश्लेषण उपकरण
SYNOPSIS
Fastqc seqfile1 seqfile2 .. seqfileN
Fastqc [-o आउटपुट dir] [--(no)extract] [-f fastq|bam|sam]
[-सी दूषित फ़ाइल] seqfile1 .. seqfileN
वर्णन
FastQC अनुक्रम फ़ाइलों का एक सेट पढ़ता है और प्रत्येक से एक गुणवत्ता नियंत्रण उत्पन्न करता है
रिपोर्ट में कई अलग-अलग मॉड्यूल शामिल हैं, जिनमें से प्रत्येक में मदद मिलेगी
अपने डेटा में किसी अन्य संभावित प्रकार की समस्या की पहचान करें।
यदि कमांड लाइन पर प्रोसेस करने के लिए कोई फाइल निर्दिष्ट नहीं है तो प्रोग्राम होगा
एक इंटरैक्टिव ग्राफिकल एप्लिकेशन के रूप में शुरू करें। अगर फाइलें उपलब्ध कराई जाती हैं
कमांड लाइन तो प्रोग्राम बिना किसी उपयोगकर्ता इंटरैक्शन के चलेगा। इसमें
मोड यह एक मानकीकृत विश्लेषण पाइपलाइन में शामिल करने के लिए उपयुक्त है।
कार्यक्रम के लिए विकल्प इस प्रकार हैं:
-h --मदद
इस सहायता फ़ाइल को प्रिंट करें और बाहर निकलें
-v --संस्करण
प्रोग्राम का संस्करण प्रिंट करें और बाहर निकलें
-o --बाहर
निर्दिष्ट आउटपुट निर्देशिका में सभी आउटपुट फ़ाइलें बनाएँ। कृपया ध्यान दें कि यह
निर्देशिका मौजूद होनी चाहिए क्योंकि प्रोग्राम इसे नहीं बनाएगा। यदि यह विकल्प सेट नहीं है
फिर प्रत्येक अनुक्रम फ़ाइल के लिए आउटपुट फ़ाइल उसी निर्देशिका में बनाई जाती है जैसे
अनुक्रम फ़ाइल जिसे संसाधित किया गया था।
-- कसावा
फ़ाइलें कच्चे कसावा आउटपुट से आती हैं। समान नमूना समूह में फ़ाइलें (केवल भिन्न
समूह संख्या द्वारा) का विश्लेषण व्यक्तिगत रूप से करने के बजाय एक सेट के रूप में किया जाएगा। दृश्यों
हेडर में सेट फ़िल्टर फ़्लैग के साथ विश्लेषण से बाहर रखा जाएगा। फ़ाइलें
उनके पास कसावा द्वारा दिए गए समान नाम होने चाहिए (जिसमें gzipped और . भी शामिल है)
.gz के साथ समाप्त होता है) अन्यथा उन्हें एक साथ सही ढंग से समूहीकृत नहीं किया जाएगा।
--निचोड़
यदि सेट किया जाता है तो ज़िप की गई आउटपुट फ़ाइल उसी निर्देशिका में असम्पीडित हो जाएगी
इसे बनाया गया है। डिफ़ॉल्ट रूप से यह विकल्प सेट किया जाएगा यदि Fastqc चलाया जाता है
गैर-संवादात्मक मोड।
-j --जावा
जावा बाइनरी के लिए पूर्ण पथ प्रदान करता है जिसे आप Fastqc लॉन्च करने के लिए उपयोग करना चाहते हैं। अगर नहीं
आपूर्ति की गई तो जावा को आपके रास्ते में माना जाता है।
--कोई निष्कर्ष नहीं
आउटपुट फ़ाइल को बनाने के बाद उसे असम्पीडित न करें। आपको यह विकल्प सेट करना चाहिए यदि
गैर-संवादात्मक मोड में चलते समय आप आउटपुट को असम्पीडित नहीं करना चाहते हैं।
--नोग्रुप
>50bp पढ़ने के लिए आधारों का समूहन अक्षम करें। सभी रिपोर्ट प्रत्येक के लिए डेटा दिखाएगी
पढ़ने में आधार। चेतावनी: इस विकल्प का उपयोग करने से Fastqc क्रैश हो जाएगा और जल जाएगा
यदि आप इसे वास्तव में लंबे समय तक पढ़ने पर उपयोग करते हैं, और आपके भूखंडों का आकार हास्यास्पद हो सकता है।
आपको चेतावनी दी गई है!
-f --प्रारूप
सामान्य अनुक्रम फ़ाइल स्वरूप पहचान को बायपास करता है और प्रोग्राम को उपयोग करने के लिए बाध्य करता है
निर्दिष्ट प्रारूप। वैध प्रारूप हैं bam,sam,bam_mapped,sam_mapped और fastq
-t --धागे
उन फ़ाइलों की संख्या निर्दिष्ट करता है जिन्हें एक साथ संसाधित किया जा सकता है। प्रत्येक धागा
250MB मेमोरी आवंटित की जाएगी ताकि आपको अपने से अधिक थ्रेड नहीं चलाने चाहिए
उपलब्ध मेमोरी का सामना करना होगा, और 6 बिट मशीन पर 32 से अधिक थ्रेड नहीं होंगे
-c एक गैर-डिफ़ॉल्ट फ़ाइल निर्दिष्ट करता है जिसमें . की सूची होती है
--संदूषक
स्क्रीन के लिए दूषित दृश्यों के खिलाफ अतिप्रतिनिधित्व। फ़ाइल में होना चाहिए
नाम [टैब] अनुक्रम के रूप में नामित दूषित पदार्थों के सेट। ए के साथ उपसर्ग वाली रेखाएं
हैश को नजरअंदाज कर दिया जाएगा।
-k -- किमी
Kmer सामग्री मॉड्यूल में देखने के लिए Kmer की लंबाई निर्दिष्ट करता है। निर्दिष्ट Kmer
लंबाई 2 और 10 के बीच होनी चाहिए। निर्दिष्ट नहीं होने पर डिफ़ॉल्ट लंबाई 5 है।
-q --शांत
स्टडआउट पर सभी प्रगति संदेशों को रोकें और केवल त्रुटियों की रिपोर्ट करें।
onworks.net सेवाओं का उपयोग करके ऑनलाइन Fastqc का उपयोग करें