אנגליתצרפתיתספרדי

Ad


סמל OnWorks

cmcalibrate - מקוון בענן

הפעל cmcalibrate בספק אירוח חינמי של OnWorks על אובונטו Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

זוהי הפקודה cmcalibrate שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

תָכְנִית:

שֵׁם


cmcalibrate - התאם זנבות מעריכיים לקביעת מודל קוווריאציה E-value

תַקצִיר


cmcalibrate [אפשרויות] cmfile

תיאור


cmcalibrate קובע פרמטרי זנב אקספוננציאליים לקביעת ערך E על ידי יצירה
רצפים אקראיים, חיפוש בהם עם ה-CM ואיסוף התוצאות של התוצאות
להיטים. היסטוגרמה של ציוני הסיביות של הפגיעות מתאימה לזנב אקספוננציאלי, וה-
הפרמטרים של הזנב המותאם נשמרים בקובץ CM. פרמטרי הזנב האקספוננציאלי
לאחר מכן משמשים להערכת המובהקות הסטטיסטית של כניסות שנמצאו ב cmsearch ו
cmscan.

יש לכייל עם קובץ CM cmcalibrate לפני שניתן להשתמש בו cmsearch or cmscan,
למעט חריג בודד: אין צורך לכייל קבצי CM הכוללים בלבד
דגמים עם אפס זוגות בסיס לפני הריצה cmsearch.

cmcalibrate הוא איטי מאוד. זה לוקח כמה שעות לכייל גודל ממוצע יחיד
CM על מעבד יחיד. cmcalibrate יפעל במקביל על כל הליבות הזמינות אם Infernal
נבנה על מערכת התומכת בהברגה של POSIX (ראה סעיף ההתקנה של
מדריך למשתמש למידע נוסף). באמצעות ליבות יביאו בערך פי
האצה לעומת מעבד בודד. ניתן להשתמש גם ב-MPI (ממשק העברת הודעות).
הקבלה עם ה --מפי אפשרות אם Infernal נבנתה עם MPI מופעל, אך באמצעות
יותר מ-161 מעבדים אינה מומלצת מכיוון שהעלאה מעבר ל-161 לא תאיץ
את הכיול. עיין בחלק ההתקנה של המדריך למשתמש למידע נוסף.

אל האני --תַחֲזִית ניתן להשתמש באפשרות כדי להעריך כמה זמן ייקח לתוכנית לפעול במשך א
נתן cmfile במכונה הנוכחית. כדי לחזות את זמן הריצה מעבדים עם
MPI, השתמש בנוסף ב- --nforecast אוֹפְּצִיָה.

הרצפים האקראיים חיפשו cmcalibrate נוצרים על ידי HMM שהוכשר עליו
רצפים גנומיים אמיתיים עם תכני GC שונים. המטרה היא לקבל את הפצות ה-GC
ברצפים האקראיים להיות דומים לאלה שברצפים הגנומיים בפועל.

מבוצעים ארבעה סבבים של חיפושים והתאמות אקספוננציאליות לאחר מכן, אחד עבור כל אחד
ארבעת האלגוריתמים השונים של CM שניתן להשתמש בהם cmsearch ו cmscan: גלוקל CYK,
glocal Inside, מקומי CYK ו-Local Inside.

הפרמטרים E-values ​​שנקבעו על ידי cmcalibrate משמשים רק את cmsearch ו cmscan
תוכניות. אם אינך מתכוון להשתמש בתוכנות אלו, אל תבזבז זמן בכיול
הדגמים שלך.

אפשרויות


-h עֶזרָה; הדפס תזכורת קצרה לגבי השימוש בשורת הפקודה והאפשרויות הזמינות.

-L הגדר את האורך הכולל של רצפים אקראיים לחיפוש מגה-בסיסים (Mb). על ידי
ברירת מחדל is 1.6 מגה-ביט. גָדֵל יגרום לזנב האקספוננציאלי להתאים יותר
מדויקים וערכים E מדויקים יותר, אך יידרשו זמן רב יותר (הכפלה יהיה בערך
להכפיל את זמן הריצה). פּוֹחֵת לא מומלץ מכיוון שהוא יגרום ל
מתאים פחות מדויק וערכי ה-E פחות מדויקים.

אפשרויות עבור חיזוי נדרש זמן ו זיכרון


--תַחֲזִית
חזה את זמן הריצה של הכיול של cmfile (עם אפשרויות מסופקות) על
המכונה הנוכחית וצא. הכיול לא מבוצע. התחזיות
יש להתייחס להערכות גסות. אם ריבוי השרשורים מופעל (ראה
סעיף ההתקנה במדריך למשתמש), התזמון ייקח בחשבון את המספר
של ליבות זמינות.

--nforecast
עם --תַחֲזִית, לציין זאת ישמשו מעבדים לכיול.
זה עשוי להיות שימושי לניבוי זמן הריצה של ריצת MPI עם
מעבדים.

--memreq
חזה את כמות הזיכרון הנדרש לכיול cmfile (עם מסופק
אפשרויות) במחשב הנוכחי וצא. הכיול לא מבוצע.

אפשרויות שליטה אקספוננציאלי זָנָב מתאים


--gtailn
להתאים את הזנב האקספוננציאלי עבור גלוקלי Inside ו- CYK גלוקלי ל- הציונים הגבוהים ביותר
בזנב ההיסטוגרמה, איפה is פעמים מספר Mb שחיפשו. ה
ערך ברירת המחדל של הוא 250. הערך 250 נבחר כי הוא עובד היטב
אמפירית ביחס לערכים אחרים.

--לטיילן
התאימו את הזנב האקספוננציאלי עבור Inside מקומי ו-CYK מקומי ל- הציונים הגבוהים ביותר
בזנב ההיסטוגרמה, איפה is פעמים מספר Mb שחיפשו. ה
ערך ברירת המחדל של הוא 750. הערך 750 נבחר כי הוא עובד היטב
אמפירית ביחס לערכים אחרים.

--זנב
התעלם מה- --gtailn ו --לטיילן אפשרויות עם קידומת ולהתאים את שבריר זנב של
ההיסטוגרמה לזנב אקספוננציאלי, עבור כל מצבי החיפוש.

אופציונאלי תפוקה קבצים


--hfile
שמור את ההיסטוגרמות בהתאמה לקובץ . הפורמט של קובץ זה הוא שני רווחים
עמודות מופרדות לכל שורה. העמודה הראשונה היא ערכי ציר ה-x של ציוני סיביות של
כל פח. העמודה השנייה היא ערכי ציר ה-y של מספר ההתאמות לכל סל. כל אחד
סדרה מופרדת על ידי קו עם תו בודד "&". הקובץ יכיל
סדרה אחת לכל אחד מארבעת הזנב האקספוננציאלי מתאים בסדר הבא:
גלוקל CYK, גלוקלי פנימה, מקומי CYK, ובפנים מקומי.

--sfile
שמור מידע על עלילת הישרדות לקובץ . הפורמט של קובץ זה הוא שני רווחים
עמודות מופרדות לכל שורה. העמודה הראשונה היא ערכי ציר ה-x של ציוני סיביות של
כל פח. העמודה השנייה היא ערכי ציר ה-y של חלק מהתאמות שעונה על או
לחרוג מהניקוד עבור כל פח. כל סדרה מופרדת בקו עם סינגל
אופי "&". הקובץ יכיל שלוש סדרות של נתונים עבור כל אחד מארבעת ה-CM
מצבי חיפוש בסדר הבא: גלוקל CYK, גלוקלי בתוך, מקומי CYK, ו
מקומי בפנים. הסדרה הראשונה היא עלילת ההישרדות האמפירית מההיסטוגרמה
של כניסות לרצף האקראי. הסדרה השנייה היא ההתאמה של הזנב האקספוננציאלי
ההתפלגות האמפירית. הסדרה השלישית היא התאמת הזנב האקספוננציאלית אם למבדה
תוקנה ונקבע כיומן הטבעי של 2 (0.691314718).

--qqfile
שמור מידע על כמות כמות לקובץ . הפורמט של הקובץ הזה הוא
שתי עמודות מופרדות ברווחים בכל שורה. העמודה הראשונה היא ערכי ציר ה-x, ו
העמודה השנייה היא ערכי ציר ה-y. מרחק הנקודות מה
קו זהות (y=x) הוא מדד למידת ההתאמה של הזנב האקספוננציאלי, ה
הנקודות קרובות יותר לקו הזהות, כך ההתאמה טובה יותר. כל סדרה היא
מופרד בשורה עם תו בודד "&". הקובץ יכיל סדרה אחת
של נתונים אמפיריים עבור כל אחד מארבעת הזנב האקספוננציאלי מתאים להלן
סדר: גלוקל CYK, גלוקל Inside, מקומי CYK ו-Local Inside.

--file
חסוך מקום סטטיסטיקה מופרדת של התאמות זנב מעריכי שונות לקובץ .
הקובץ יכיל את ערכי lambda ו-mu עבור זנבות אקספוננציאליים בהתאמה
זנבות היסטוגרמה בגדלים שונים. השדות בקובץ מסומנים בתווית
באופן אינפורמטיבי.

--xfile
שמור רשימה של הציונים בכל זנב היסטוגרמה מתאים לקובץ . כל שורה של
לקובץ זה יהיה ניקוד שונה המציין פגיעה אחת שקיימת בזנב עם
הציון הזה. כל סדרה מופרדת בשורה עם תו בודד "&". ה
הקובץ יכיל סדרה אחת עבור כל אחד מארבעת התאמות הזנב המעריכיות ב-
הסדר הבא: CYK גלוקלי, Inside גלוקלי, CYK מקומי ו-Inside מקומי.

אחר אפשרויות


--זֶרַע
זרעי את מחולל המספרים האקראיים עם , מספר שלם >= 0. אם אינו אפס,
הדמיות סטוכסטיות יהיו ניתנות לשחזור; אותה פקודה תיתן את אותו הדבר
תוצאות. אם הוא 0, מחולל המספרים האקראיים מוזרע באופן שרירותי, ו
סימולציות סטוכסטיות ישתנו מהפעלה להרצה של אותה פקודה. ברירת המחדל
הזרע הוא 181.

--בטא
כברירת מחדל, נעשה שימוש ב-Query-dependent banding (QDB) כדי להאיץ את החיפוש ב-CM
אלגוריתמים עם הסתברות לאובדן זנב בטא של 1E-15. ערך בטא זה יכול להיות
שונה ל עם --בטא . פרמטר הבטא הוא כמות ההסתברות
מסה לא נכללת במהלך חישוב הלהקה, ערכים גבוהים יותר של בטא נותנים מהירות גבוהה יותר
אבל להקריב יותר דיוק מאשר ערכים נמוכים יותר. ערך ברירת המחדל בשימוש הוא 1E-15.
(למידע נוסף על QDB ראה Nawrocki and Eddy, PLoS Computational Biology
3(3): e56.)

--לא רצועות
כבה את QDB במהלך כיול E-value. זה יאט את הכיול.

--nonull3
כבה את דגם null3 post-hoc נוסף. זה לא מומלץ אלא אם כן
אתה מתכנן להשתמש באותה אפשרות כדי cmsearch ו / או cmscan.

--אַקרַאִי
השתמש במודל null הרקע של ה-CM כדי ליצור את הרצפים האקראיים, במקום זאת
של HMM המציאותי יותר. אלא אם כן ה-CM נבנה באמצעות ה- --ריק אפשרות ל
cmbuild, מודל האפס של הרקע יהיה 25% כל A, C, G ו-U.

--gc
צור את הרצפים האקראיים באמצעות התפלגות הנוקלאוטידים מהרצף
פילה .

--מעבד
ציין זאת יש להשתמש בעובדי CPU מקבילים. אם מוגדר כ-"0", ואז ה-
התוכנית תופעל במצב טורי, ללא שימוש בשרשורים. אתה יכול גם לשלוט
מספר זה על ידי הגדרת משתנה סביבה, INFERNAL_NCPU. אפשרות זו תהיה
יהיה זמין רק אם המכונה שעליה נבנתה Infernal מסוגלת להשתמש
השרשור POSIX (ראה סעיף התקנה במדריך למשתמש למידע נוסף
מֵידָע).

--מפי הפעל כתוכנית MPI מקבילה. אפשרות זו תהיה זמינה רק אם Infernal יש
הוגדר ונבנה עם הדגל "--enable-mpi" (ראה את ההתקנה
במדריך למשתמש למידע נוסף).

השתמש ב-cmcalibrate באינטרנט באמצעות שירותי onworks.net


שרתים ותחנות עבודה בחינם

הורד אפליקציות Windows & Linux

פקודות לינוקס

Ad