זהו הפקודה cdhit שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS
תָכְנִית:
שֵׁם
cdhit - רצפים קבצים במהירות
תַקצִיר
cdhit [אפשרויות]
תיאור
====== CD-HIT גרסה 4.6 (נבנה ב-23 בינואר 2016) ======
אפשרויות
-i קלט שם קובץ בפורמט fasta, נדרש
-o שם קובץ פלט, נדרש
-c סף זהות רצף, ברירת מחדל 0.9 זהו ברירת המחדל של CD-hit "global
זהות רצף" מחושב כך: מספר חומצות אמינו זהות ביישור
לחלק באורך המלא של הרצף הקצר יותר
-G השתמש בזהות רצף גלובלי, ברירת מחדל 1 אם מוגדר ל-0, ולאחר מכן השתמש ברצף מקומי
זהות, מחושב כ: מספר חומצות אמינו זהות ביישור חלקי
אורך היישור הערה!!! לא להשתמש -G 0 אלא אם כן אתה משתמש ביישור
בקרות כיסוי ראה אפשרויות -אל, -אל, -כפי ש, -כפי ש
-b רוחב_פס של יישור, ברירת מחדל 20
-M מגבלת זיכרון (בMB) עבור התוכנית, ברירת מחדל 800; 0 ללא הגבלה;
-T מספר שרשורים, ברירת מחדל 1; עם 0, כל המעבדים ישמשו
-n word_length, ברירת מחדל 5, עיין במדריך למשתמש לבחירתו
-l אורך רצפי_זריקה, ברירת מחדל 10
-t סובלנות לעודפות, ברירת מחדל 2
-d אורך התיאור בקובץ clstr, ברירת מחדל 20 אם מוגדר ל-0, זה לוקח את ה-fasta
defline ועוצר ברווח הראשון
-s חתך הפרשי אורך, ברירת מחדל 0.0 אם מוגדר ל-0.9, הרצפים הקצרים יותר צריכים
להיות באורך של לפחות 90% מנציג האשכול
-S חתך הפרש אורך בחומצת אמינו, ברירת מחדל 999999 אם מוגדר ל-60, האורך
ההבדל בין הרצפים הקצרים יותר לבין הנציג של האשכול יכול
לא יהיה גדול מ-60
-אל כיסוי יישור עבור הרצף הארוך יותר, ברירת מחדל 0.0 אם מוגדר ל-0.9, ה
היישור חייב לכסות 90% מהרצף
-אל בקרת כיסוי יישור עבור הרצף הארוך יותר, ברירת המחדל 99999999 אם מוגדרת ל-60,
ואורך הרצף הוא 400, אז היישור חייב להיות >= 340 (400-60)
שאריות
-כפי ש כיסוי יישור עבור הרצף הקצר יותר, ברירת מחדל 0.0 אם מוגדר ל-0.9, ה
היישור חייב לכסות 90% מהרצף
-כפי ש בקרת כיסוי יישור עבור הרצף הקצר יותר, ברירת המחדל 99999999 אם מוגדרת ל-60,
ואורך הרצף הוא 400, אז היישור חייב להיות >= 340 (400-60)
שאריות
-A בקרת כיסוי יישור מינימלית עבור שני הרצפים, יישור ברירת מחדל 0 חייב
cover >= ערך זה עבור שני הרצפים
-uL אחוז מרבי ללא תואם עבור הרצף הארוך יותר, ברירת מחדל 1.0 אם מוגדר ל-0.1,
האזור ללא התאמה (לא כולל פערים מובילים וזנבים) לא יכול להיות יותר מ-10%
של הרצף
-לָנוּ אחוז מרבי ללא תואם עבור הרצף הקצר יותר, ברירת מחדל 1.0 אם מוגדר ל-0.1,
האזור ללא התאמה (לא כולל פערים מובילים וזנבים) לא יכול להיות יותר מ-10%
של הרצף
-U אורך מקסימלי ללא תואם, ברירת מחדל 99999999 אם מוגדר ל-10, האזור ללא תואם
(לא כולל פערים מובילים וזנבים) לא יהיו יותר מ-10 בסיסים
-B 1 או 0, ברירת מחדל 0, כברירת מחדל, רצפים מאוחסנים ב-RAM אם מוגדר ל-1, רצף
מאוחסנים בכונן קשיח מומלץ להשתמש -B 1 עבור מסדי נתונים ענקיים
-p 1 או 0, ברירת המחדל 0 אם מוגדרת ל-1, חפיפת יישור הדפסה בקובץ clstr
-g 1 או 0, ברירת מחדל 0 לפי אלגוריתם ברירת המחדל של cd-hit, רצף מקובץ ל-
אשכול ראשון שעומד בסף (אשכול מהיר). אם מוגדר ל-1, התוכנית תעשה זאת
רכז אותו לאשכול הדומה ביותר שעומד בסף (מדויק אך איטי
מצב) אבל 1 או 0 לא ישנו את הנציגים של אשכולות סופיים
-בק כתוב קובץ אשכול גיבוי (1 או 0, ברירת מחדל 0)
-h להדפיס עזרה זו
שאלות, באגים, צור קשר עם Limin Fu בכתובת [מוגן בדוא"ל], או Weizhong Li ב [מוגן בדוא"ל]
לגירסאות מעודכנות ומידע, בקר בכתובת: http://cd-hit.org
שרת האינטרנט cd-hit זמין גם מ http://cd-hit.org
אם אתה מוצא תקליטורים שימושיים, נא לצטט:
"קיבוץ של רצפים הומולוגיים ביותר כדי להקטין את הגודל של חלבון גדול
מסד נתונים", Weizhong Li, Lukasz Jaroszewski & Adam Godzik. ביואינפורמטיקה, (2001)
17:282-283 "סובלנות של יתירות מסוימת מזרזת באופן משמעותי צבירת קבוצות גדולות
מאגרי מידע של חלבונים", ויז'ונג לי, לוקאש ירוסבסקי ואדם גודז'יק. ביואינפורמטיקה,
(2002) 18:77-82
השתמש ב-cdhit באינטרנט באמצעות שירותי onworks.net