זוהי הפקודה cdhit-454 שניתן להריץ בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS
תָכְנִית:
שֵׁם
cd-hit-454 - רצפים קבצים במהירות, מותאם ל-454 נתונים
תַקצִיר
cdhit-454 [אפשרויות]
תיאור
====== CD-HIT גרסה 4.6 (נבנה ב-23 בינואר 2016) ======
אפשרויות
-i קלט שם קובץ בפורמט fasta, נדרש
-o שם קובץ פלט, נדרש
-c סף זהות רצף, ברירת מחדל 0.98 זוהי "זהות רצף גלובלית"
מחושב כ: מספר חומצות אמינו זהות ביישור חלקי מלא
אורך הרצף הקצר יותר + פערים
-b רוחב_פס של יישור, ברירת מחדל 10
-M מגבלת זיכרון (בMB) עבור התוכנית, ברירת מחדל 800; 0 ללא הגבלה;
-T מספר שרשורים, ברירת מחדל 1; עם 0, כל המעבדים ישמשו
-n word_length, ברירת מחדל 10, עיין במדריך למשתמש לבחירתו
-אל כיסוי יישור עבור הרצף הארוך יותר, ברירת מחדל 0.0 אם מוגדר ל-0.9, ה
היישור חייב לכסות 90% מהרצף
-אל בקרת כיסוי יישור עבור הרצף הארוך יותר, ברירת המחדל 99999999 אם מוגדרת ל-60,
ואורך הרצף הוא 400, אז היישור חייב להיות >= 340 (400-60)
שאריות
-כפי ש כיסוי יישור עבור הרצף הקצר יותר, ברירת מחדל 0.0 אם מוגדר ל-0.9, ה
היישור חייב לכסות 90% מהרצף
-כפי ש בקרת כיסוי יישור עבור הרצף הקצר יותר, ברירת המחדל 99999999 אם מוגדרת ל-60,
ואורך הרצף הוא 400, אז היישור חייב להיות >= 340 (400-60)
שאריות
-B 1 או 0, ברירת מחדל 0, כברירת מחדל, רצפים מאוחסנים ב-RAM אם מוגדר ל-1, רצף
מאוחסנים בכונן קשיח מומלץ להשתמש -B 1 עבור מסדי נתונים ענקיים
-g 1 או 0, ברירת מחדל 0 לפי אלגוריתם ברירת המחדל של cd-hit, רצף מקובץ ל-
אשכול ראשון שעומד בסף (אשכול מהיר). אם מוגדר ל-1, התוכנית תעשה זאת
רכז אותו לאשכול הדומה ביותר שעומד בסף (מדויק אך איטי
מצב) אבל 1 או 0 לא ישנו את הנציגים של אשכולות סופיים
-D גודל מקסימלי לאינדל, ברירת מחדל 1
-התאמה ציון תואם, ברירת מחדל 2
-חוסר התאמה
ציון לא תואם, ברירת מחדל -1
-פער ציון פתיחת פער, ברירת מחדל -3
-gap-ext
ציון הרחבת פער, ברירת מחדל -1
-בק כתוב קובץ אשכול גיבוי (1 או 0, ברירת מחדל 0)
-h להדפיס עזרה זו
שאלות, באגים, צור קשר עם Weizhong Li ב [מוגן בדוא"ל]
אם אתה מוצא תקליטורים שימושיים, נא לצטט:
"קיבוץ של רצפים הומולוגיים ביותר כדי להקטין את הגודל של חלבון גדול
מסד נתונים", Weizhong Li, Lukasz Jaroszewski & Adam Godzik. ביואינפורמטיקה, (2001)
17:282-283 "Cd-hit: תוכנית מהירה לאיסוף והשוואה של סטים גדולים של
רצפי חלבון או נוקלאוטידים", Weizhong Li & Adam Godzik. ביואינפורמטיקה, (2006)
22:1658-1659 "Beifang Niu, Limin Fu, Shulei Sun and Weizhong Li.
כפילויות טבעיות בקריאות פירוזיס של נתונים מטאנומיים. BMC ביואינפורמטיקה
(2010) 11:187 בבוקר
השתמש ב-cdhit-454 באינטרנט באמצעות שירותי onworks.net