GoGPT Best VPN GoSearch

סמל OnWorks

נחיל - אונליין בענן

הפעל את Swarm בספק האירוח החינמי OnWorks דרך Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

זהו פקודה מסוג swarm שניתן להריץ בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות החינמיות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS.

תָכְנִית:

שֵׁם


נחיל - למצוא אשכולות של אמפליקונים נוקלאוטידים כמעט זהים

תַקצִיר


נחיל [ אפשרויות ] שם הקובץ

תיאור


מחקרים מולקולריים סביבתיים או קליניים מייצרים כמויות גדולות של אמפליקונים (למשל, 16S
או רצפי 18S SSU-rRNA) שיש לאגד אותם לטקסונומיה אופרטיבית מולקולרית
יחידות (OTUs). שיטות אשכול נפוצות מבוססות על חמדנות ותלויות בסדר קלט
אלגוריתמים, עם בחירה שרירותית של גודל אשכול גלובלי וצנטרואידים של אשכול.
לטפל בבעיה הזו, פיתחנו נחיל, שיטה מהירה וחזקה שמקבצת באופן רקורסיבי
אמפליקונים עם d או פחות הבדלים. נחיל מייצר אשכולות טבעיים ויציבים במרכזם
בשיאי שפע מקומיים, ללא תלות בסדר קלט המושרה על ידי בחירת מרכז.

קיבוץ מדויק אינו מעשי על מערכי נתונים גדולים בעת שימוש בגישה נאיבית של הכל נגד הכל
(ליתר דיוק, שילוב של 2 ללא חזרות), מכיוון שזה מרמז על מספרים לא מציאותיים של
השוואות זוגיות. נחיל מבוסס על מספר מקסימלי של הבדלים d בין שתיים
אמפליקונים, ומתמקד רק בקשרים מקומיים קרובים מאוד. d = 1 (ערך ברירת מחדל),
נחיל משתמש באלגוריתם בעל מורכבות ליניארית שמבצע התאמה מדויקת של מחרוזות על ידי
השוואת ערכי גיבוב. עבור d = 2 או יותר, נחיל משתמש באלגוריתם של ריבועי
מורכבות שמבצעת השוואות מחרוזות זוגיות. יעיל kסינון מבוסס-mer
ושימוש מושכל בתוצאות השוואתיות שהתקבלו במהלך תהליך קיבוץ האשכולות מאפשר
הימנעו מרוב השוואות האמפליקון הנדרשות בגישה נאיבית. כדי לזרז את
השוואות אמפליקון שנותרו, נחיל מיישם Needleman-Wunsch מהיר במיוחד
אלגוריתם המשתמש ב-Streaming SIMD Extensions (SSE2) של מעבדי x86-64 מודרניים. אם
הוראות SSE2 אינן זמינות, נחיל יוצא עם הודעת שגיאה.

נחיל קורא את הקלט בעל השם שם הקובץ, קובץ פאסטה של ​​אמפליקונים של נוקלאוטידים. האמפליקון
מזהה מוגדר כמחרוזת הנמצאת בין הסימן ">" לבין הרווח הראשון
או סוף השורה, המוקדם מביניהם. נחיל רשימות פלטים של אמפליקון
מזהים, מזהי אמפליקון חייבים להיות ייחודיים כדי למנוע עמימות; נחיל יוצא עם
הודעת שגיאה אם ​​המזהים אינם ייחודיים. מזהי אמפליקון חייבים להסתיים ב-"_"
ואחריו מספר שלם חיובי המייצג את מספר עותקי האמפליקון (או השפע)
ביאור; משתמשי usearch/vsearch יכולים להשתמש באפשרות -z כדי לשנות התנהגות זו).
ביאורי שפע ממלאים תפקיד מכריע בתהליך האשכול, ונחיל יוצא עם
הודעת שגיאה אם ​​מידע זה אינו זמין. רצף האמפליקונים מוגדר כ
מחרוזת של סמלים [acgt] או [acgu] (לא תלויי רישיות), שמתחילה אחרי סוף ה-
שורת המזהה וסיומה לפני שורת המזהה הבאה או סוף הקובץ; נחיל יציאות
עם הודעת שגיאה אם ​​קיים סמל אחר.

כללי אפשרויות
-b, --גְבוּל חיובי מספר שלם
בעת שימוש באפשרות --fastidious (-f), יש להגדיר את המסה המינימלית של OTU גדול
כמספר שניתן עם אפשרות זו. ערך ברירת המחדל הוא 3, דבר המציין שכל
OTU בעל מסה של 3 או יותר נחשב "גדול". כברירת מחדל, OTU נחשב "קטן" אם
יש לו מסה של 2 או פחות, כלומר הוא מורכב מאמפליקון אחד של
שפע 2, או שני אמפליקונים של שפע 1. כל ערך חיובי גדול מ-1
ניתן לציין. שימוש בערכי גבול גבוהים יותר יאיץ את המעבר השני, אך
גם להפחית את הרזולוציה הטקסונומית של נחיל תוצאות.

-c, --תִקרָה חיובי מספר שלם
בעת שימוש באפשרות --fastidious (-f), יש להגדיר נחילטביעת הרגל המרבית של הזיכרון
(במגה-בייט). נחיל יתאים את הערך --bloom-bits (-y) של מסנן Bloom
כדי להתאים לכמות הזיכרון שצוינה. אפשרות זו אינה פעילה על ידי
ברירת המחדל.

-d, --הבדלים אפס or חיובי מספר שלם
מספר ההפרשים המרבי המותר בין שני אמפליקונים, כלומר שניים
אמפליקונים יקובצו אם יש להם מספר שלם (או פחות) הבדלים. זהו
נחילהפרמטר החשוב ביותר של. מספר ההפרשים מחושב כ-
מספר אי-ההתאמות (החלפות, הוספות או מחיקות) בין השניים
אמפליקונים לאחר שנמצא היישור הזוגי הגלובלי האופטימלי (ראה
"אפשרויות מתקדמות ליישור זוגי" להשפעה על שלב זה). כלשהו מספר שלם
ניתן להשתמש במספרים שבין 0 ל-256, אך גבוהים d ערכים יקטין את הטקסונומיה
רזולוציה של נחיל תוצאות. נפוץ בשימוש d הערכים הם 1, 2 או 3, לעתים רחוקות גבוהים יותר.
כשמשתמש d = 0, נחיל יפיק תוצאות התואמות ל- קפדני
דה-רפליקציה של מערך הנתונים, כלומר מיזוג אמפליקונים זהים. אזהרה, נחיל
עדיין דורש ערכי fasta כדי להציג ערכי שפע. מספר ברירת מחדל של
ההבדלים הם 1.

-f, --בַּררָנִי
כשעובדים עם d = 1, בצע מעבר אשכול שני כדי להפחית את מספר ה-
יחידות OTU קטנות (אפשרות מומלצת). במהלך תהליך הקיבוץ עם d = 1, א
אמפליקון ביניים יכול להיות חסר מסיבות סטוכסטיות גרידא, מה שיתפרץ
תהליך הצבירה. אפשרות זו תיצור אמפליקונים וירטואליים, שיאפשרו
להשתיל OTUs קטנים על גבי OTUs גדולים יותר. כברירת מחדל, OTU נחשב "קטן" אם יש לו מסה.
של 2 או פחות (ראו את האפשרות --boundary כדי להגדיל את הערך הזה). כדי לזרז את העניינים
למעלה, נחיל משתמש במסנן Bloom כדי לאחסן תוצאות ביניים. אזהרה, השני הזה
המעבר יכול להיות איטי פי 2 עד 3 מהמעבר הראשון ודורש הרבה יותר
זיכרון. ראה את האפשרויות --bloom-bits (-y) או --ceiling (-c) כדי לשלוט בזיכרון
טביעת רגל של מסנן Bloom. אזהרה, האפשרות fastidious משנה את קיבוץ האשכולות
תוצאות. קבצי הפלט שנוצרו על ידי האפשרויות --log (-l), --output-file (-o),
--mothur (-r), --uclust-file, ו--seeds (-w) מעודכנים כדי לשקף את אלה.
שינויים; הקובץ --statistics-file (-s) עודכן חלקית (עמודות 6
ו-7 אינם מעודכנים); קובץ הפלט --internal-structure (-i) אינו מעודכן.

-h, - עזרה
הצג את העזרה הזו וצא.

-n, --ללא שבירת otu
בטל את עידון ה-OTU המובנה (לא מומלץ). שפע אמפליקונים
ערכים משמשים לזיהוי מעברים בין OTUs הנמצאים במגע ולהפרדה
אותם, מה שמניב תוצאות אשכול ברזולוציה גבוהה יותר. אפשרות זו מונעת זאת
הפרדה, ובפועל, מאפשרת יצירת קשר בין אמפליקונים A
ו-B, גם אם שפע B גבוה משפע A.

-t, --חוטים חיובי מספר שלם
מספר חוטי החישוב לשימוש. מספר החוטים צריך להיות קטן יותר או
שווה למספר ליבות המעבד הזמינות. מספר הליכים ברירת המחדל הוא 1.

-v, --גִרְסָה
פלט מידע גרסה ויציאה.

-y, --פריחה-ביטים חיובי מספר שלם
בעת שימוש באפשרות --fastidious (-f), יש להגדיר את הגודל (בסיביות) של כל ערך
במסנן Bloom. אפשרות זו מאפשרת לאזן את היעילות (כלומר, המהירות)
וטביעת הרגל של הזיכרון של מסנן Bloom. ערכים גדולים יגרום ל-Bloom
מסנן יעיל יותר אך ידרוש יותר זיכרון. כל ערך בין 4 ל-20
ניתן להשתמש בו. ערך ברירת המחדל הוא 16. ראה את האפשרות --ceiling (-c) עבור
דרך חלופית לשליטה על שטח הזיכרון.

פלט קלט אפשרויות
-a, --תוספת-שפע חיובי מספר שלם
הגדר ערך שפע לשימוש כאשר חלק מהאמפליקונים או כל האמפליקונים בקובץ הקלט חסרים
ערכי שפע. אזהרה, לא מומלץ להשתמש נחיל על מערכי נתונים שבהם
ערכי השפע זהים כולם. אנו מספקים אפשרות זו כמחווה ל
משתמשים מתקדמים, אנא השתמשו בזהירות. נחיל נסגר עם הודעת שגיאה אם
חסרים ערכי שפע ואם לא נעשה שימוש באפשרות זו.

-i, --מבנה פנימי שם הקובץ
פלט את כל זוגות האמפליקונים הכמעט זהים אל שם הקובץ באמצעות חמש עמודות
פורמט מופרד בטאבים:

1. תווית אמפליקון A.

2. תווית אמפליקון B.

3. מספר ההבדלים בין אמפליקונים A ו-B (חיובי מספר שלם).

4. מספר OTU (חיובי מספר שלםיחידות OTU ממוספרות לפי סדרן
תיחום, החל מ-1. כל זוגות האמפליקונים השייכים ל-
אותו OTU יקבל את אותו מספר.

5. מספר הצעדים מזרע ה-OTU לאמפליקון B (חיובי מספר שלם).

-l, --עֵץ שם הקובץ
פלט את כל ההודעות אל שם הקובץ במקום תֶקֶן שגיאה, חוץ מ
הודעות שגיאה כמובן. אפשרות זו שימושית במצבים שבהם כתיבה אל
תֶקֶן שגיאה בעייתי (לדוגמה, עם מתזמני משימות מסוימים).

-o, --קובץ פלט שם הקובץ
תוצאות אשכול פלט ל שם הקובץהתוצאות מורכבות מרשימה של יחידות OTU, OTU אחד
לכל שורה. OTU הוא רשימה של מזהי אמפליקון המופרדים ברווחים. ברירת מחדל
הוא לכתוב לפלט סטנדרטי.

-r, --אמא
קיבוץ פלטים מביא לפורמט התואם ל-Mothur. אפשרות זו
משנה נחילפורמט הפלט המוגדר כברירת מחדל.

-s, קובץ-סטטיסטיקה שם הקובץ
סטטיסטיקות פלט ל שם הקובץהקובץ הוא טבלה מופרדת בטאבים עם OTU אחד לכל
שורה ושבע עמודות מידע:

1. מספר אמפליקונים ייחודיים ב-OTU,

2. מספר העותקים הכולל של האמפליקונים ב-OTU,

3. מזהה הזרע הראשוני,

4. מספר עותק זרע ראשוני,

5. מספר אמפליקונים עם מספר עותקים של 1 ב-OTU,

6. מספר מקסימלי של איטרציות לפני שה-OTU הגיע למצבו הטבעי
גבולות),

7. רדיוס מקסימלי תיאורטי של ה-OTU (כלומר, מספר מצטבר
הבדלים בין הזרע לאמפליקון הרחוק ביותר ב-OTU).
הרדיוס המקסימלי בפועל של ה-OTU הוא לעתים קרובות קטן בהרבה.

-u, קובץ --uclust שם הקובץ
קיבוץ פלט מביא לפורמט קובץ דמוי uclust לקובץ שצוין. זה
האפשרות לא משתנה נחילפורמט הפלט המוגדר כברירת מחדל.

-w, --זרעים שם הקובץ
פלט נציגי OTU ל שם הקובץ בפורמט פאסטה. ערך השפע של
כל נציג הוא סכום השפע של כל האמפליקונים ב-OTU.

-z, --שפע של מחקר
קבל ערכי שפע אמפליקונים בסגנון usearch/vsearch
(>תווית;גודל=מספר שלםאפשרות זו משפיעה על סגנון ביאור השפע
משמש בקבצי פלט.

לפי זוג יישור מתקדם אפשרויות
בעת שימוש d > 1, נחיל מזהה אפשרויות שורת פקודה מתקדמות המשנות את הזוגיות
פרמטרים גלובליים של ניקוד יישור:

-m, --תגמול-התאמה חיובי מספר שלם
הגדר את הפרס עבור התאמת נוקלאוטידים. ברירת המחדל היא 5.

-p, --עונש-אי-התאמה חיובי מספר שלם
הגדר את העונש עבור אי התאמה של נוקלאוטידים. ברירת המחדל היא 4.

-g, --עונש-פתיחת-פער חיובי מספר שלם
הגדר את עונש הפער הפתוח. ברירת המחדל היא 12.

-e, --עונש-הארכת-פער חיובי מספר שלם
הגדר את עונש הרחבת הפער. ברירת המחדל היא 4.

As נחיל מתמקד במערכות יחסים קרובות (למשל d = 2 או 3), תוצאות קיבוץ האשכולות הן
עמיד בפני שינויים בפרמטרים של מודל יישור זוגי. שינוי פרמטרים של מודל
יש השפעה חזקה יותר בעת קיבוץ אשכולות באמצעות ערך גבוה יותר d ערך.

דוגמאות


אוסף את מערך הנתונים באשכולות myfile.fasta לתוך OTUs עם הרזולוציה הטובה ביותר האפשרית (1
הפרש, שבירה מובנית, אפשרות קפדנית) באמצעות 4 חוטי חישוב. OTUs הם
נכתב לקובץ myfile.swarms, ונציגי OTU נכתבו אליהם
myfile.representatives.fasta.

נחיל -t 4 -f -w myfile.representatives.fasta < myfile.fasta > myfile.swarms

מחברים


קונספט מאת Frédéric Mahé, יישום על ידי Torbjørn Rognes.

QUOTE


Mahé F, Rognes T, Quince C, de Vargas C, Dunthorn M. (2014) נחיל: חזק ומהיר
שיטת אשכול למחקרים מבוססי אמפליקון. peerj 2:e593
<http://dx.doi.org/10.7717/peerj.593>

Mahé F, Rognes T, Quince C, de Vargas C, Dunthorn M. (2015) Swarm v2: ניתן להרחבה גבוהה ו
קיבוץ אמפליקונים ברזולוציה גבוהה. peerj 3:e1420http://dx.doi.org/10.7717/peerj.1420>

דיווח באגים


שלחו הצעות ודיווחי באגים ב , לשלוח א
בקשת משיכה ב , או לחבר הודעה ידידותית או עצבנית
דוא"ל לפרדריק מאהה[מוגן בדוא"ל]וטורביורן רוגנס[מוגן בדוא"ל]>.

זמינות


התוכנה זמינה מ

זכויות יוצרים


זכויות יוצרים (C) 2012, 2013, 2014, 2015 Frédéric Mahé & Torbjørn Rognes

תוכנית זו היא תוכנה חופשית: אתה יכול להפיץ אותה מחדש ו/או לשנות אותה בתנאים של
גם הרישיון הציבורי הכללי של GNU Affero כפי שפורסם על ידי קרן התוכנה החופשית
גרסה 3 של הרישיון, או כל גרסה מאוחרת יותר.

תוכנית זו מופצת בתקווה שהיא תהיה שימושית, אך ללא כל אחריות;
אפילו ללא האחריות המשתמעת של סחירות או התאמה למטרה מסוימת.
ראה את הרישיון הציבורי הכללי של GNU Affero לפרטים נוספים.

היית צריך לקבל עותק של הרישיון הציבורי הכללי של GNU Affero יחד עם זה
תכנית. אם לא, ראהhttp://www.gnu.org/licenses/>.

השתמש ב-swarm online באמצעות שירותי onworks.net


שרתים ותחנות עבודה בחינם

הורד אפליקציות Windows & Linux

פקודות לינוקס

Ad




×
פרסומת
❤️קנו, הזמינו או קנו כאן - ללא עלות, עוזר לשמור על שירותים בחינם.