tigr-build-icm - מקוון בענן

זוהי הפקודה tigr-build-icm שניתן להריץ בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות החינמיות שלנו כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS.

תָכְנִית:

שֵׁם


tigr-glimmer - יוצר ומפיק מודל מרקוב אינטרפולטיבי (IMM)

תַקצִיר


tigr-build-icm

תיאור


התוכנית build-icm.c יוצרת ומפיקה מודל מרקוב (IMM) אינטרפולציה כמתואר
במאמר AL Delcher, D. Harmon, S. Kasif, O. White, and SL Salzberg. משופר
זיהוי גנים מיקרוביאליים בעזרת Glimmer. מחקר חומצות גרעין, 1999, בדפוס.
אנא עיין במאמר זה אם אתה משתמש במערכת כחלק ממחקר כלשהו שפורסם.

הקלט מגיע מהקובץ ששמו מופיע בשורת הפקודה. הפורמט צריך להיות מחרוזת אחת לכל
שורה. לכל שורה יש מחרוזת מזהה ואחריה רווח לבן ולאחריה הרצף עצמו.
הסקריפט run-glimmer3 יוצר קובץ קלט בפורמט הנכון באמצעות הקובץ 'extract'.
תכנית.

ה-IMM בנוי באופן הבא: עבור הקשר נתון, נניח acgtta, אנו רוצים להעריך
התפלגות ההסתברות של התו הבא. נעשה זאת בצורה ליניארית
שילוב של התפלגויות ההסתברות הנצפות עבור הקשר זה וכל שלו
סיומות, כלומר, cgtta, gtta, tta, ta, a וריק. בהתפלגות נצפות אני מתכוון ל
ספירות של מספר המופעים של מחרוזות אלו בקבוצת האימון. הפונקציה הליניארית
השילוב נקבע על ידי קבוצת הסתברויות, lambda, אחת עבור כל מחרוזת הקשר.
עבור acgtta בהקשר, מקדמי הצירוף הליניאריים הם:

למבדה (acgtta) (1 - למבדה (acgtta)) x למבדה (cgtta) (1 - למבדה (acgtta)) x (1 - למבדה
(cgtta)) x למבדה (gtta) (1 - למבדה (acgtta)) x (1 - למבדה (cgtta)) x (1 - למבדה
(gtta)) x למבדה (tta) (1 - למבדה (acgtta)) x (1 - למבדה (cgtta)) x (1 - למבדה (gtta))
x (1 - למבדה (טא)) x (1 - למבדה (טא)) x (1 - למבדה (א))

אנו מחשבים את ערכי הלמבדה עבור כל הקשר באופן הבא: - אם מספר התצפיות
בקבוצת האימונים הוא >= הקבוע SAMPLE_SIZE_BOUND, הלמבדה עבור הקשר זה היא
1.0 - אחרת, בצעו מבחן כי בריבוע על התצפיות עבור הקשר זה בהשוואה ל-
התפלגות צפויה עבור הקשר הסיומת הקצרה יותר בתו אחד. אם כי בריבוע
מובהקות < 0.5, הגדר את ה-lambda עבור הקשר זה ל-0.0 אחרת הגדר את ה-lambda עבור
הקשר זה ל: (משמעות כי בריבוע) x (מספר תצפיות) / SAMPLE_WEIGHT

כדי להפעיל את התוכנית:

בנה-ICM דגם רכבת

פעולה זו תשתמש בנתוני האימון ב-train.seq כדי לייצר את הקובץ train.model, המכיל
ה-IMM שלך.

השתמש ב-tigr-build-icm באופן מקוון באמצעות שירותי onworks.net



התוכניות המקוונות האחרונות של לינוקס ו-Windows