זהו הפקודה formatdb שניתן להריץ בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS
תָכְנִית:
שֵׁם
formatdb - פורמט מסדי נתונים של חלבון או נוקלאוטידים עבור BLAST
תַקצִיר
formatdb [-] [-B שם הקובץ] [-F שם הקובץ] [-L שם הקובץ] [-T שם הקובץ] [-V] [-a] [-b] [-e]
[-i שם הקובץ] [-l שם הקובץ] [-n str] [-o] [-p F] [-s] [-t str] [-v N]
תיאור
formatdb חייב לשמש על מנת לעצב מסדי נתונים של מקור חלבון או נוקלאוטידים לפני כן
ניתן לחפש בבסיסי נתונים אלה באמצעות blastall, blastpgp או MegaBLAST. מסד הנתונים של המקור
יכול להיות בפורמט FASTA או ASN.1. למרות שפורמט FASTA משמש לרוב בתור
קלט ל formatdb, השימוש ב-ASN.1 הוא יתרון למי שמשתמש ב-ASN.1 בתור
מקור משותף לפורמטים אחרים כגון דוח GenBank. פעם קובץ מסד נתונים מקור
עוצב על ידי formatdb זה לא נחוץ על ידי BLAST. שימו לב שאם אתם כן
הולך להחיל עדכונים תקופתיים על מסדי הנתונים של BLAST שלך באמצעות להתמזג(1), תצטרך
לשמור את קובץ מסד הנתונים של המקור.
אפשרויות
סיכום האפשרויות כלול להלן.
- הדפס הודעת שימוש
-B שם הקובץ
Gifil בינארי מופק מה-Gife שצוין על ידי -F. אפשרות זו מציינת את
שם של קובץ רשימת GI בינארית. יש להשתמש באפשרות זו עם ה -F אוֹפְּצִיָה. א
רשימת GI של טקסט עשויה להיות מוגדרת עם ה- -F אפשרות וה -B אפשרות תייצר
רשימת ה-GI בפורמט בינארי. הקובץ הבינארי קטן יותר ואין צורך ב-BLAST
כדי להמיר אותו, כך שניתן יהיה לקרוא אותו מהר יותר.
-F שם הקובץ
Gifile (קובץ המכיל רשימה של gi's) לשימוש עם -B or -L
-L שם הקובץ
צור קובץ כינוי בשם שם הקובץ, הגבלת הרצפים שמחפשים לאלו
שצוין על ידי -F.
-T שם הקובץ
הגדר את מזהי הטקסונומיה בהגדרות ASN.1 לפי הטבלה ב שם הקובץ.
-V מילולית: בדוק אם יש מזהי מחרוזת לא ייחודיים במסד הנתונים
-a קובץ הקלט הוא מסד נתונים בפורמט ASN.1 (אחרת צפויה FASTA)
-b מסד הנתונים של ASN.1 הוא בינארי (בניגוד לטקסט ASCII)
-e הקלט הוא ערך Seq. מסד נתונים של מקור ASN.1 (טקסט ascii או בינארי) עשוי
מכילים ערכת Bioseq או רק Bioseq אחת. במקרה האחרון -e צריך לספק.
-i שם הקובץ
קבצי קלט לעיצוב
-l שם הקובץ
שם קובץ יומן (ברירת מחדל = formatdb.log)
-n str שם הבסיס עבור קבצי BLAST (ברירת המחדל של השם של קובץ ה-FASTA המקורי)
-o נתח SeqID וצור אינדקסים. אם מסד הנתונים של המקור הוא בפורמט FASTA, ה-
מזהי מסד נתונים בשורת ההגדרות של FASTA חייבים לפעול לפי המוסכמות של
פורמט FASTA Defline.
-p F הקלט הוא נוקלאוטיד, לא חלבון.
-s אינדקס רק לפי הצטרפות, לא לפי לוקוס. זה שימושי במיוחד עבור ערכות רצף
כמו ה-EST שבו שמות ההצטרפות והמקומות זהים. Formatdb פועל
מהיר יותר ומייצר קבצים זמניים קטנים יותר אם משתמשים באפשרות זו. זה חזק
מומלץ עבור EST's, STS's, GSS's ו-HTGS's.
-t str כותרת לקובץ מסד הנתונים [מחרוזת]
-v N חלקו קבצי FASTA גדולים ל'נפחים' בגודל N מיליון מכתבים (4000 על ידי
בְּרִירַת מֶחדָל). כחלק מיצירת כרך, formatdb כותב סוג חדש של BLAST
קובץ מסד נתונים, הנקרא קובץ כינוי, עם הסיומת `nal' או `pal'.
השתמש ב-formatdb באינטרנט באמצעות שירותי onworks.net