זוהי הפקודה tigr-build-icm שניתן להריץ בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות החינמיות שלנו כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS.
תָכְנִית:
שֵׁם
tigr-glimmer - יוצר ומפיק מודל מרקוב אינטרפולטיבי (IMM)
תַקצִיר
tigr-build-icm
תיאור
התוכנית build-icm.c יוצרת ומפיקה מודל מרקוב (IMM) אינטרפולציה כמתואר
במאמר AL Delcher, D. Harmon, S. Kasif, O. White, and SL Salzberg. משופר
זיהוי גנים מיקרוביאליים בעזרת Glimmer. מחקר חומצות גרעין, 1999, בדפוס.
אנא עיין במאמר זה אם אתה משתמש במערכת כחלק ממחקר כלשהו שפורסם.
הקלט מגיע מהקובץ ששמו מופיע בשורת הפקודה. הפורמט צריך להיות מחרוזת אחת לכל
שורה. לכל שורה יש מחרוזת מזהה ואחריה רווח לבן ולאחריה הרצף עצמו.
הסקריפט run-glimmer3 יוצר קובץ קלט בפורמט הנכון באמצעות הקובץ 'extract'.
תכנית.
ה-IMM בנוי באופן הבא: עבור הקשר נתון, נניח acgtta, אנו רוצים להעריך
התפלגות ההסתברות של התו הבא. נעשה זאת בצורה ליניארית
שילוב של התפלגויות ההסתברות הנצפות עבור הקשר זה וכל שלו
סיומות, כלומר, cgtta, gtta, tta, ta, a וריק. בהתפלגות נצפות אני מתכוון ל
ספירות של מספר המופעים של מחרוזות אלו בקבוצת האימון. הפונקציה הליניארית
השילוב נקבע על ידי קבוצת הסתברויות, lambda, אחת עבור כל מחרוזת הקשר.
עבור acgtta בהקשר, מקדמי הצירוף הליניאריים הם:
למבדה (acgtta) (1 - למבדה (acgtta)) x למבדה (cgtta) (1 - למבדה (acgtta)) x (1 - למבדה
(cgtta)) x למבדה (gtta) (1 - למבדה (acgtta)) x (1 - למבדה (cgtta)) x (1 - למבדה
(gtta)) x למבדה (tta) (1 - למבדה (acgtta)) x (1 - למבדה (cgtta)) x (1 - למבדה (gtta))
x (1 - למבדה (טא)) x (1 - למבדה (טא)) x (1 - למבדה (א))
אנו מחשבים את ערכי הלמבדה עבור כל הקשר באופן הבא: - אם מספר התצפיות
בקבוצת האימונים הוא >= הקבוע SAMPLE_SIZE_BOUND, הלמבדה עבור הקשר זה היא
1.0 - אחרת, בצעו מבחן כי בריבוע על התצפיות עבור הקשר זה בהשוואה ל-
התפלגות צפויה עבור הקשר הסיומת הקצרה יותר בתו אחד. אם כי בריבוע
מובהקות < 0.5, הגדר את ה-lambda עבור הקשר זה ל-0.0 אחרת הגדר את ה-lambda עבור
הקשר זה ל: (משמעות כי בריבוע) x (מספר תצפיות) / SAMPLE_WEIGHT
כדי להפעיל את התוכנית:
בנה-ICM דגם רכבת
פעולה זו תשתמש בנתוני האימון ב-train.seq כדי לייצר את הקובץ train.model, המכיל
ה-IMM שלך.
השתמש ב-tigr-build-icm באופן מקוון באמצעות שירותי onworks.net