هذا هو الأمر المصغر الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة على الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
miniasm - de novo المجمع لتسلسلات قراءة طويلة
موجز
التصغير [-ب12 فولت] [-m مين ماتش] [-i مين] [-s مينسبان] [-c مينكوف] [-o minOvlp] [-h
ماكسهانج] [-I intThres] [-g maxGap الفرق] [-d maxBubDist] [-e minUtgSize] [-f إقرا الملف] [-n
n جولات] [-r معدل الإسقاط] [-F المعدل النهائي] [-p الإخراج] mapping.paf > الإخراج. gfa
الوصف
Miniasm عبارة عن أداة تجميع de novo سريعة جدًا تعتمد على OLC لقراءات طويلة صاخبة. يستغرق كل شيء مقابل-
جميع التعيينات الذاتية قراءة بتنسيق PAF كمدخلات ومخرجات رسم بياني تجميعي في GFA
شكل. تختلف miniasm عن المجمعات السائدة ، ليس لديها خطوة إجماع. هو - هي
يربط ببساطة أجزاء من متواليات القراءة لتوليد تسلسلات الوحدة النهائية. هكذا
معدل الخطأ لكل قاعدة مشابه لقراءات المدخلات الأولية.
OPTIONS
الاختيار الأولي الخيارات
-m INT إسقاط التعيينات التي تحتوي على أقل من INT قواعد المطابقة (عمود 10 في PAF) [100]. هذا
الخيار له نفس الدور مثل -L من الخريطة المصغرة.
-s INT إسقاط التعيينات أقصر من INT-bp [1000]. يؤثر هذا الخيار أيضًا على الخيار الثاني
جولة تصفية القراءة والحد الأدنى من طول التداخل.
-i تطفو أثناء تصفية القراءة ، تجاهل التعيينات مع col10 / col11 أدناه تطفو [0.05].
لا تزال التعيينات التي تم تجاهلها مستخدمة لقراءة التداخلات.
-c INT الحد الأدنى من التغطية بقراءات أخرى [3]. في الجولة الأولى من التصفية ، miniasm
يجد أطول منطقة يغطيها INT أو قراءات أكثر. في الجولة الثانية ، عليه
بالإضافة إلى ذلك يتطلب تغطية كل قاعدة متبقية INT قواعد على الأقل
مينسبان/ 2 من نهايات القراءات الأخرى.
تداخل الخيارات
-o INT الحد الأدنى لطول التداخل [نفس مينسبان]
-h INT الحد الأقصى لطول البروز [1000]. المتراكمة هي منطقة غير محددة يجب أن تكون
تعيين تداخل حقيقي أو احتواء حقيقي. إذا كانت المتراكمة طويلة جدًا ،
يعتبر التعيين مطابقة داخلية وسيتم تجاهله.
-I تطفو الحد الأدنى لنسبة طول التعيين إلى التعيين + الطول المتدلي لرسم الخرائط
تعتبر احتواء أو تداخل [0.8]. هذا الخيار له دور مماثل لـ
-h، إلا أنه يتحكم في النسبة وليس الطول.
رسم بياني نسق الخيارات
-g INT فرق الفجوة القصوى بين قراءتين في رسم الخرائط [1000]. هذه المعلمة
تستخدم فقط للحد المتعدي.
-d INT أقصى مسافة فحص لفرقعة الفقاعة [50000]. فقاعات أطول من INT
لن يتم تفرقع.
-e INT تعتبر الوحدة صغيرة إذا كانت تتكون من أقل من INT يقرأ [4].
قد يحاول Miniasm إزالة الوحدات الصغيرة في خطوات مختلفة.
-f FILE قراءة ملف التسلسل بتنسيق FASTA أو FASTQ لتوليد تسلسلات unitig
[باطل]. إذا لم يكن هذا الخيار موجودًا ، فإن miniasm ينتج عنه ناتج GFA بدون
متواليات.
-r FLOAT1 ، [FLOAT2]
الحد الأقصى ونسبة الحد الأدنى من التداخل المتداخل [0.7,0.5،XNUMX]. دع التداخل (v-> w) يكون التداخل
طول الحافة v-> w و maxovlp (v) = max_w {التداخل (v-> w)} يكون طول أكبر
تداخل. تتداخل قطرات Miniasm v-> w إذا كان التداخل (v-> w) / maxovlp (v) أقل من a
العتبة التي يتحكم فيها هذا الخيار. ينطبق Miniasm n جولات جولات قصيرة
إزالة التداخل مع عتبة متزايدة بين تعويم1 و تعويم2.
-n INT جولات إزالة التداخل القصير [3].
-F تطفو عتبة نسبة انخفاض التداخل بعد إزالة الوحدة القصيرة [0.8]
منوع الخيارات
-b أشر إلى أنه في الإدخال ، من المحتمل أن يتم تقديم نفس التعيين مرتين
-1 تخطي الجولة الأولى من تحديد قراءة التجميع المسبق
-2 تخطي الجولة الثانية من تحديد قراءة التجميع المسبق
-p STR معلومات الإخراج والشكل [ug]. ممكن STR تشمل القيم - السرير: بريد-
مناطق القراءة المفلترة بتنسيق BED ؛ انطلق: التعيينات بين بعد التصفية
يقرأ. sg: قراءة الرسم البياني المتداخل بتنسيق GFA ؛ ug: الرسم البياني unitig في GFA
تنسيق.
-V طباعة رقم النسخة على stdout
INPUT FORMAT
يقرأ Miniasm مواضع التعيين في تنسيق mApping الزوجي (PAF) ، وهو علامة تبويب-
تنسيق نص محدد مع كل سطر يتكون من 12 حقلاً على الأقل كما هو موضح في
الجدول التالي:
┌────┬────────┬─────────────────────────────────── ──────────────────────────┐
│مع │ النوع │ الوصف │
├────┼────────┼─────────────────────────────────── ──────────────────────────┤
│ 1 │ سلسلة اسم تسلسل الاستعلام │
│ 2 │ int طول تسلسل الاستعلام │
│ 3 │ int │ بدء تنسيق الاستعلام (على أساس 0) │
│ 4 │ int │ تنسيق نهاية الاستعلام (على أساس 0) │
│ 5 char │ `+ 'إذا كان الاستعلام والهدف على نفس الخيط ؛ "- 'إذا كان العكس │
│ 6 │ سلسلة اسم تسلسل الهدف │
│ 7 │ int طول التسلسل المستهدف │
│ 8 │ int │ الهدف تنسيق البدء على الخيط الأصلي │
│ 9 │ int │ تنسيق النهاية المستهدفة على الشريط الأصلي │
│ 10 │ int عدد قواعد المطابقة في التعيين │
│ 11 │ int قواعد الأرقام ، بما في ذلك الفجوات ، في التعيين │
│ 12 │ int │ تعيين الجودة (0-255 مع 255 للمفقودين) │
└────┴────────┴─────────────────────────────────── ──────────────────────────┘
يرجى الاطلاع على مصغره(1) للحصول على وصف تفصيلي لكل حقل.
OUTPUT FORMAT
ينتج Miniasm التجميع في تنسيق تجميع الأجزاء الرسومية (GFA). إنها
تنسيق محدد بعلامة تبويب يستند إلى سطر ، حيث يشير الحرف الأول إلى نوع السطر.
يوضح الجدول التالي أنواع الخطوط التي يستخدمها miniasm:
┌─────┬─────────────┬───────────────────────────── ───────────────────────┐
│خط │ الرسالة │ ثابت الحقول │
├─────┼─────────────┼───────────────────────────── ───────────────────────┤
│ H │ Header │ N / A
│ S Segment SegName segSeq
│ L │ التداخل │ segName1 segOri1 segName2 segOri2 ovlp CIGAR │
│ a │ المسار الذهبي │ utgName utgStart readName: قراءة البداية والنهاية
└─────┴─────────────┴───────────────────────────── ───────────────────────┘
استخدم miniasm عبر الإنترنت باستخدام خدمات onworks.net