هذا هو الأمر mhap الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة على الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
mhap - تداخل تسلسل احتمالي
الوصف
يرجى ضبط -s أو ال -p خيارات. راجع الخيارات أدناه: MHAP: بروتوكول محاذاة MinHash.
أداة للعثور على تداخلات التسلسلات طويلة القراءة (مثل PacBio أو Nanopore) في
المعلوماتية الحيوية.
الإصدار: 1.6، وقت البناء: 09/12/2015 11:46 م الاستخدام 1 (تنفيذ مباشر): java
-الخادم -XMX -إناء -s[-q
ملف>] [-f ] الاستخدام 2 (إنشاء محسوبة مسبقًا
ثنائيات): جافا -الخادم -XMX -إناء -p
-q [-F ]
--تنسيقالافتراضي = خطأ
خيار تجريبي.
- محاذاة تعويضالافتراضي = -0. 535
الإزاحة لحساب التباين في نتيجة مباراة المحاذاة.
- نقاط المحاذاة، الافتراضي = 1.0E-6
النتيجة النهائية لمباريات المحاذاة.
- عتبة التصفية، الافتراضي = 1.0E-5
[مزدوج] ، القطع الذي يتم عنده اعتبار k-mer في ملف مرشح k-mer
تكرارية. يتم تحديد هذه القيمة لـ k-mer معين في العمود الثاني في
ملف المرشح. إذا لم يتم توفير ملف مرشح ، فسيتم تجاهل هذا الخيار.
--مساعدةالافتراضي = خطأ
يعرض قائمة المساعدة.
- ماكس تحول، الافتراضي = 0.2
[مزدوج] ، حجم المنطقة على يسار ويمين التداخل المقدر ، كما هو مشتق
من متوسط التحول وطول التسلسل ، حيث لا تزال تطابقات k-mer
تعتبر صالحة. مرشح المرحلة الثانية فقط.
- min-store-length، الافتراضي = 0
[int] ، الحد الأدنى لطول القراءة المخزنة في المربع. تستخدم للتصفية
قراءات قصيرة من ملف FASTA.
- نانوبور بسرعةالافتراضي = خطأ
اضبط جميع المعلمات لإعدادات Nanopore السريعة. هذا هو الأفضل حاليا
التوجيه ، ويمكن أن تتغير في أي وقت دون سابق إنذار.
--لا ذاتيالافتراضي = خطأ
لا تحسب التداخلات بين التسلسلات داخل المربع. يجب استخدامه عندما يكون ملف
من وإلى التسلسلات تأتي من ملفات مختلفة.
- عدد التجزئات، الافتراضي = 512
[int] ، عدد min-mers التي سيتم استخدامها في MinHashing.
- عدد-دقيقة-مباريات، الافتراضي = 3
[int] ، الحد الأدنى من # min-mer التي يجب مشاركتها قبل حساب مرشح المرحلة الثانية.
أي تسلسلات أقل من هذه القيمة تعتبر غير متداخلة.
- عدد الخيوط، الافتراضي = 12
[int] ، عدد الخيوط المستخدمة في الحساب. يتم الضبط عادةً على 2 × # نقاط.
- سريعالافتراضي = خطأ
اضبط جميع المعلمات لإعداد PacBio السريع. هذا هو الأفضل حاليا
التوجيه ، ويمكن أن تتغير في أي وقت دون سابق إنذار.
- حساسة للمكانالافتراضي = خطأ
اضبط جميع المعلمات لإعدادات PacBio الحساسة. هذا هو الأفضل حاليا
التوجيه ، ويمكن أن تتغير في أي وقت دون سابق إنذار.
- مخزن كامل معرفالافتراضي = خطأ
قم بتخزين المعرفات الكاملة كما هو موضح في ملف FASTA ، بدلاً من تخزين التسلسل فقط
موقف في الملف. تحتوي بعض ملفات FASTA على IDS طويل ، مما يؤدي إلى إبطاء إخراج النتائج.
يتم تجاهل هذه الخيارات عند استخدام تنسيق ملف مضغوط.
--عتبة، الافتراضي = 0.04
[مزدوج] ، درجة تشابه العتبة المقطوعة لدمج الفرز في المرحلة الثانية
منقي. يعتمد هذا على متوسط عدد k-mers المطابقة في التداخل
منطقة.
--الإصدارالافتراضي = خطأ
يعرض الإصدار ووقت البناء.
--موزونالافتراضي = خطأ
أداء MinHashing الموزون.
-f، افتراضي = ""
ملف مرشح k-mer يستخدم لتصفية k-mers المتكررة للغاية. يجب فرزها
بترتيب تنازلي للتردد (العمود الثاني).
-hالافتراضي = خطأ
يعرض قائمة المساعدة.
-k، الافتراضي = 16
[int] ، حجم k-mer المستخدم في MinHashing. حجم k-mer لمرشح المرحلة الثانية هو
منفصلة ، ولا يمكن تعديلها.
-p، افتراضي = ""
الاستخدام 2 فقط. الدليل الذي يحتوي على ملفات FASTA التي يجب تحويلها إلى
تنسيق ثنائي للتخزين.
-q، افتراضي = ""
الاستخدام 1: ملف FASTA للقراءات ، أو دليل الملفات ، التي سيتم مقارنتها بـ
مجموعة القراءات في المربع (انظر -s). الاستخدام 2: دليل الإخراج للثنائي
ملفات dat المنسقة.
-s، افتراضي = ""
استخدام 1 فقط. ملف FASTA أو ملف dat الثنائي (انظر الاستخدام 2) للقراءات التي ستكون
مخزنة في صندوق ، وسيتم مقارنة جميع القراءات اللاحقة بـ.
استخدم mhap عبر الإنترنت باستخدام خدمات onworks.net