GoGPT Best VPN GoSearch

סמל OnWorks

hmmbuild - מקוון בענן

הפעל את hmmbuild בספק אירוח בחינם של OnWorks על אובונטו מקוון, פדורה מקוון, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

זוהי הפקודה hmmbuild שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

תָכְנִית:

שֵׁם


hmmbuild - בניית פרופיל HMM(ים) ממספר רצפים יישור(ים)

תַקצִיר


הממ לבנות [אפשרויות]

תיאור


עבור כל יישור רצף מרובה ב בנה פרופיל HMM ושמור אותו לפרופיל חדש
פילה .

עשוי להיות '-' (מקף), כלומר קריאת קלט זה סטדין במקום קובץ.
כדי להשתמש ב-'-', עליך לציין גם את פורמט קובץ היישור עם --אינפורמט , כמו ב
--אינפורמט שטוקהולם (בגלל מגבלה נוכחית ביישום שלנו, קובץ MSA
לא ניתן לזהות פורמטים באופן אוטומטי בזרם קלט שאינו ניתן לאחור.)

אולי לא '-' (סטדout), כי שליחת קובץ HMM אל stdout היה
מתנגש עם פלט הטקסט האחר של התוכנית.

אפשרויות


-h עֶזרָה; הדפס תזכורת קצרה לגבי השימוש בשורת הפקודה וכל האפשרויות הזמינות.

-n תן שם לפרופיל החדש . ברירת המחדל היא להשתמש בשם היישור (אם כזה
נמצא ב msafile, או, אם לא, השם של ה- hmmfile. אם msafile
מכיל יותר מישור אחד, -n לא עובד, ולכל יישור חייב להיות א
שם המובא ב- msafile (כמו בשטוקהולם #=ביאור מזהה GF).

-o הפנה את פלט הסיכום לקובץ , במקום ל stdout.

-O לאחר בניית כל דגם, שמור מחדש את המקור המובא, אולי שונה
יישור לקובץ בפורמט שטוקהולם. היישורים מסומנים ב-a
שורת התייחסות המציינת אילו עמודות הוקצו כקונצנזוס, וכן
רצפים מסומנים עם משקלי הרצף היחסיים שהוקצו. כמה
ייתכן ששאריות של היישור הועברו כדי להתאים למגבלות של
ארכיטקטורת פרופיל Plan7, אשר מונעת מעברים בין הוספה למחיקה
מדינות.

אפשרויות עבור מפרט LA אלף בית


סוג האלפבית (אמינו, DNA או RNA) מזוהה אוטומטית כברירת מחדל, על ידי הסתכלות על
הרכב של msafile. זיהוי אוטומטי הוא בדרך כלל די אמין, אבל מדי פעם
סוג האלפבית עשוי להיות מעורפל וזיהוי אוטומטי עלול להיכשל (לדוגמה, על צעצוע זעיר
יישור של כמה שאריות בלבד). כדי למנוע זאת, או כדי להגביר את החוסן באוטומט
צינורות ניתוח, תוכל לציין את סוג האלפבית של msafile עם האפשרויות הללו.

--אמינו
ציין שכל הרצפים ב msafile הם חלבונים.

--דנ"א ציין שכל הרצפים ב msafile הם DNA.

--rna ציין שכל הרצפים ב msafile הם RNA.

אפשרויות שליטה פּרוֹפִיל בְּנִיָה


אפשרויות אלה קובעות כיצד עמודות קונצנזוס מוגדרות ביישור.

--מָהִיר הגדר עמודות קונצנזוס כעמודות שיש להן שבר >= סימפרק של שאריות כמו
מתנגד לפערים. (ראה להלן עבור --symfrac אפשרות.) זוהי ברירת המחדל.

--יד הגדר עמודות קונצנזוס בפרופיל הבא באמצעות הערת הפניה לכפולה
יישור. זה מאפשר לך להגדיר כל עמודות קונצנזוס שאתה אוהב.

--symfrac
הגדר את סף שבר השאריות הדרוש להגדרת עמודת קונצנזוס מתי
באמצעות --מָהִיר אוֹפְּצִיָה. ברירת המחדל היא 0.5. שבר הסמל בכל עמודה הוא
מחושב לאחר התחשבות בשקלול הרצף היחסי, והתעלמות מפער
תווים המתאימים לקצוות של קטעי רצף (בניגוד לחלק הפנימי
הוספות/מחיקות). הגדרה זו ל-0.0 פירושה שכל עמודת יישור תהיה
להקצות כקונצנזוס, מה שעשוי להיות שימושי במקרים מסוימים. מגדיר את זה ל-1.0
פירוש הדבר שרק עמודות הכוללות 0 פערים (הוספות/מחיקות פנימיות) יהיו
מוקצה כקונצנזוס.

--fragthresh
אנו רוצים לספור פערים סופניים כמחיקות רק אם הרצף המיושר ידוע
להיות באורך מלא, לא אם הוא קטע (לדוגמה, כי רק חלק ממנו
היה ברצף). HMMER משתמש בכלל פשוט כדי להסיק שברים: אם הטווח של a
רצף ביישור (מספר עמודות היישור בין הראשון ל-
המיקומים האחרונים של הרצף) קטן או שווה לשבר פעמים
אורך יישור בעמודות, ואז הרצף מטופל כשבר. ה
ברירת המחדל היא 0.5. הגדרה --fragthresh0 יגדיר שום רצף (לא ריק) בתור א
רסיס; אולי תרצה לעשות זאת אם אתה יודע שיש לך אוצר בקפידה
יישור של רצפים באורך מלא. הגדרה --fragthresh1 יגדיר הכל
רצפים כפרגמנטים; אולי תרצה לעשות זאת אם אתה יודע שהיישור שלך הוא
מורכב כולו משברים, כגון קריאה קצרה מתורגמת במטאנומית
נתוני רובה ציד.

אפשרויות שליטה קרוב משפחה משקולות


HMMER משתמש באלגוריתם שקלול רצף אד-הוק כדי להוריד משקל של רצפים קרובים
ובעלי משקל הקשורים רחוק. יש לכך השפעה של הפיכת מודלים לפחות מוטים על ידי
ייצוג פילוגנטי לא אחיד. לדוגמה, בדרך כלל שני רצפים זהים
כל אחד מקבל מחצית מהמשקל שרצף אחד יקבל. אפשרויות אלו שולטות באיזה
אלגוריתם מתרגל.

--wpb השתמש בסכימת שקלול הרצף המבוססת על מיקום הניקוף [הניקוף והניקוף,
י.מול. ביול. 243:574, 1994]. זוהי ברירת המחדל.

--wgsc השתמש באלגוריתם השקלול של Gerstein/Sonnhammer/Chothia [Gerstein et al, J. Mol.
ביול. 235:1067, 1994].

--wblosum
השתמש באותה ערכת אשכולות ששימשה לשקלול נתונים בחישוב BLOSUM
מטריצות החלפה [Henikoff and Henikoff, Proc. נאטל. אקד. Sci 89:10915, 1992].
רצפים מקובצים בחיבור יחיד בסף זהות (ברירת מחדל 0.62; ראה
--wid) ובתוך כל אשכול של רצפי c, כל רצף מקבל משקל יחסי
1/ג.

--ללא
אין משקלים יחסיים. לכל הרצפים מוקצה משקל אחיד.

--wid
מגדיר את סף הזהות בשימוש על-ידי אשכול-קישור יחיד בעת השימוש --wblosum.
לא חוקי עם כל ערכת שקלול אחרת. ברירת המחדל היא 0.62.

אפשרויות שליטה אפקטיבי סדר פעולות מספר


לאחר קביעת משקלים יחסיים, הם מנורמלים לסיכום סה"כ אפקטיבי
מספר רצף, eff_nseq. מספר זה עשוי להיות המספר האמיתי של רצפים ב-
יישור, אבל הוא כמעט תמיד קטן מזה. ברירת המחדל של שקלול האנטרופיה
שיטה (--eent) מקטין את מספר הרצף האפקטיבי כדי לצמצם את תוכן המידע
(אנטרופיה יחסית, או ציון ממוצע צפוי בהומולוגים אמיתיים) לפי עמדת קונצנזוס. ה
האנטרופיה היחסית של המטרה נשלטת על ידי פונקציה של שני פרמטרים, כאשר השניים
פרמטרים ניתנים להגדרה עם --הנה ו --אסיגמה.

--eent התאם מספר רצף אפקטיבי כדי להשיג אנטרופיה יחסית ספציפית לכל
עמדה (ראה --הנה). זוהי ברירת המחדל.

--מקבץ
הגדר מספר רצף אפקטיבי למספר אשכולות הצמדה בודדת ב-a
סף זהות ספציפי (ראה --עיד). אפשרות זו אינה מומלצת; זה בשביל
ניסויים להעריך כמה טוב יותר --eent הוא.

--enone
כבה את קביעת מספר הרצף האפקטיבית ופשוט השתמש במספר האמיתי של
רצפים. אחת הסיבות שאולי תרצה לעשות זאת היא לנסות למקסם את היחס
אנטרופיה/מיקום של המודל שלך, שעשוי להיות שימושי עבור דגמים קצרים.

--eset
הגדר במפורש את מספר הרצף האפקטיבי עבור כל הדגמים ל .

--הנה
הגדר את יעד האנטרופיה/מיקום המינימלי היחסי ל . דורש --eent. בְּרִירַת מֶחדָל
תלוי באלפבית הרצף. עבור רצפי חלבון, הוא 0.59 סיביות/מיקום;
עבור רצפי נוקלאוטידים, הוא 0.45 סיביות/מיקום.

--אסיגמה
מגדיר את האנטרופיה היחסית המינימלית שתרמה יישור מודל שלם, מעל
לכל אורכו. יש לכך השפעה של מודלים קצרים להיות בעלי יחסי גבוה יותר
אנטרופיה לכל עמדה מאשר --הנה לבד היה נותן. ברירת המחדל היא 45.0 סיביות.

--עיד
מגדיר את חיתוך הזהות השברית בזוגות המשמשת על-ידי מקבץ הצמדה בודדת עם
מה היא --מקבץ אוֹפְּצִיָה. ברירת המחדל היא 0.62.

אפשרויות שליטה PRIORS


כברירת מחדל, ספירות משוקללות מומרות לפרמטר ממוצע של הסתברות אחורית
הערכות באמצעות תערובת Dirichlet priors. תערובת ברירת מחדל Dirichlet פרמטרים קודמים עבור
מודלים של חלבון ומודלים של חומצת גרעין (RNA ו-DNA) מובנים
אפשרויות מאפשרות לך לעקוף את ברירת המחדל של הקודמים.

--pnone
אל תשתמש באף קודמים. פרמטרי הסתברות פשוט יהיו הנצפים
תדרים, לאחר שקלול רצף יחסי.

--מקום
השתמש ב-Laplace +1 prior במקום תערובת ברירת המחדל Dirichlet prior.

אפשרויות שליטה E-VALUE כִּיוּל


פרמטרי המיקום של התפלגות הציונים הצפויה עבור ציוני מסנן MSV,
ציוני סינון Viterbi וציוני Forward דורשים שלוש סימולציות קצרות של רצף אקראיות.

--EmL
מגדיר את אורך הרצף בסימולציה שמעריכה את פרמטר המיקום mu עבור
מסנן MSV ערכי אלקטרוני. ברירת המחדל היא 200.

--EmN
מגדיר את מספר הרצפים בסימולציה שמעריכה את פרמטר המיקום mu
עבור ערכי E-מסנן MSV. ברירת המחדל היא 200.

--EvL
מגדיר את אורך הרצף בסימולציה שמעריכה את פרמטר המיקום mu עבור
מסנן ויטרבי ערכי E. ברירת המחדל היא 200.

--EvN
מגדיר את מספר הרצפים בסימולציה שמעריכה את פרמטר המיקום mu
עבור ערכי E של מסנן Viterbi. ברירת המחדל היא 200.

--EfL
מגדיר את אורך הרצף בסימולציה שמעריכה את פרמטר המיקום tau
עבור Forward E-values. ברירת המחדל היא 100.

--EfN
מגדיר את מספר הרצפים בסימולציה שמעריכה את פרמטר המיקום
tau עבור Forward E-values. ברירת המחדל היא 200.

--Eft
מגדיר את חלק מסת הזנב כך שיתאים לסימולציה שמעריכה את המיקום
פרמטר tau עבור הערכות קדימה. ברירת המחדל היא 0.04.

אחר אפשרויות


--מעבד
הגדר את מספר חוטי העבודה המקבילים ל . כברירת מחדל, HMMER מגדיר זאת ל
מספר ליבות המעבד שהוא מזהה במחשב שלך - כלומר, הוא מנסה למקסם
השימוש בליבות המעבד הזמינות שלך. הגדרה גבוה ממספרם של
לליבות הזמינות יש ערך מועט אם בכלל, אבל אולי תרצה להגדיר את זה למשהו
פָּחוּת. אתה יכול גם לשלוט במספר זה על ידי הגדרת משתנה סביבה,
HMMER_NCPU.

אפשרות זו זמינה רק אם HMMER הידור עם תמיכה בשרשורי POSIX.
זוהי ברירת המחדל, אך ייתכן שהיא כובה עבור האתר או המחשב שלך
סיבה כלשהי.

--אינפורמט
הצהיר כי הקלט msafile הוא בפורמט . כרגע המכפלה המקובלת
פורמטים של קבצי רצף יישור כוללים את Stockholm, Aligned FASTA, Clustal, NCBI
PSI-BLAST, PHYLIP, Selex ו-UCSC SAM A2M. ברירת המחדל היא זיהוי אוטומטי של הפורמט של
הקובץ.

--זֶרַע
זרעי את מחולל המספרים האקראיים עם , מספר שלם >= 0. אם אינו אפס, כל
הדמיות סטוכסטיות יהיו ניתנות לשחזור; אותה פקודה תיתן את אותו הדבר
תוצאות. אם הוא 0, מחולל המספרים האקראיים מוזרע באופן שרירותי, ו
סימולציות סטוכסטיות ישתנו מהפעלה להרצה של אותה פקודה. ברירת המחדל
הזרע הוא 42.

--w_beta
מסת זנב באורך חלון. הגבול העליון, W, על האורך שבו nhmmer מצפה
כדי למצוא מופע של המודל מוגדר כך שהחלק מכל הרצפים
שנוצר על ידי המודל עם אורך >= W זה פחות מ . ברירת המחדל היא 1e-7.

--w_length
תעקוף את הגבול העליון של אורך מופע הדגם, W, שבאופן אחר נשלט על ידי
--w_beta. זה צריך להיות גדול יותר מאורך הדגם. הערך של W משמש עמוק
בצנרת האצה, ושינויים צנועים לא צפויים להשפיע על התוצאות
(אם כי ערכים גדולים יותר של W מובילים לזמן ריצה ארוך יותר).

--מפי הפעל כתוכנית MPI מקבילה. כל יישור מוקצה לצומת עובד MPI עבור
בְּנִיָה. (לכן, ההקבלה המקסימלית לא יכולה לחרוג ממספר
יישורים בקלט msafile.) זה שימושי בעת בניית פרופיל גדול
ספריות. אפשרות זו זמינה רק אם יכולת MPI אופציונלית הופעלה ב-
זמן קומפילציה.

--דוּכָן
לאיתור באגים מקבילית MPI: עצור את ביצוע התוכנית מיד לאחר מכן
התחל, והמתן לניפוי באגים שיתחבר לתהליך הפועל וישחרר את
מַעְצָר.

--maxinsertlen
הגבל פרמטר של אורך ההוספה כך שאורך ההוספה הצפוי ב-
כל מיקום של הדגם הוא לא יותר מ .

השתמש ב-hmmbuild באינטרנט באמצעות שירותי onworks.net


שרתים ותחנות עבודה בחינם

הורד אפליקציות Windows & Linux

פקודות לינוקס

Ad




×
פרסומת
❤️קנו, הזמינו או קנו כאן - ללא עלות, עוזר לשמור על שירותים בחינם.