عربيالفرنسيةالإسبانية

Ad


OnWorks فافيكون

maq - على الإنترنت في السحابة

قم بتشغيل maq في مزود استضافة OnWorks المجاني عبر Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

هذا هو الأمر maq الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة على الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

برنامج:

اسم


Maq - رسم الخرائط والتجميع بالصفات

موجز


ماك أمر [الخيارات] الحجج

maq.pl أمر [الخيارات] الحجج

الوصف


Maq هو برنامج ينشئ تجميعات تعيين من القراءات القصيرة التي تم إنشاؤها بواسطة التالي-
آلات تسلسل الجيل. إنه مصمم خصيصًا لـ Illumina-Solexa 1G Genetic
محلل ، وله وظيفة أولية للتعامل مع بيانات AB SOLiD.

مع Maq يمكنك:

محاذاة سريعة Illumina / SOLiD يقرأ إلى الجينوم المرجعي. مع الخيارات الافتراضية ، واحد
يمكن تعيين مليون زوج من القراءات على الجينوم البشري في حوالي 10 ساعات من وحدة المعالجة المركزية بأقل من ذلك
من ذاكرة 1G.

· قم بقياس احتمال الخطأ بدقة في محاذاة قراءة كل فرد.

· استدعاء الأنماط الجينية المتفق عليها ، بما في ذلك تعدد الأشكال متماثل الزيجوت ومتغاير الزيجوت ، مع
جودة احتمالية Phred مخصصة لكل قاعدة.

البحث عن indels القصيرة مع قراءات نهاية مقترنة.

العثور بدقة على عمليات الحذف الجينومية واسعة النطاق والترجمات مع قراءات نهاية مقترنة.

اكتشاف CNVs المحتملة عن طريق التحقق من عمق القراءة.

· تقييم دقة الصفات الأساسية الخام من أجهزة التسلسل والمساعدة في التحقق من
أخطاء منهجية.

ومع ذلك ، يمكن Maq لا:

· يفعل de جديد الجمعية العامة. (يمكن فقط استدعاء Maq الإجماع من خلال تعيين يقرأ إلى المعروف
المرجعي.)

· خريطة يقرأ ضد أنفسهم. (يمكن لـ Maq فقط العثور على تداخل كامل بين القراءات.)

· محاذاة الشعرية يقرأ أو 454 يقرأ للإشارة. (لا يمكن محاذاة Maq يقرأ أطول من
63 نقطة أساس).

MAQ أوامر


القفل أوامر

fasta2bfa ماك fasta2bfa in.ref.fasta out.ref.bfa

تحويل التسلسلات بتنسيق FASTA إلى تنسيق Maq's BFA (ثنائي FASTA).

fastq2bfq ماك fastq2bfq [-n نريدز] in.read.fastq خارج. قراءةout.prefix

تحويل القراءات بتنسيق FASTQ إلى تنسيق Maq BFQ (ثنائي FASTQ).

والخيارات:

-n INT عدد القراءات لكل ملف [غير محدد]

رسم خريطة ماك رسم خريطة [-n nmis] [-a ماكسينز] [-c] [-1 len1] [-2 len2] [-d التكيف3] [-m موترات]
[-u بدون خرائط] [-ه ماكسير] [-M ج⎪ز] [-N] [-H com.allhits] [-C com.maxhits] خارج الخريطة
in.ref.bfa فيread1.bfq [فيread2.bfq] 2> out.map.log

يقرأ الخريطة إلى التسلسل المرجعي.

والخيارات:

-n INT عدد حالات عدم التطابق القصوى التي يمكن العثور عليها دائمًا [2]

-a INT أقصى مسافة خارجية لزوج قراءة صحيح [250]

-A INT الحد الأقصى للمسافة الخارجية لقراءتي RF paied (0 للتعطيل) [0]

-c تقرأ الخريطة في مساحة اللون (لـ SOLiD فقط)

-1 INT طول القراءة للقراءة الأولى ، 0 للتلقائي [0]

-2 INT طول القراءة للقراءة الثانية ، 0 للتلقائي [0]

-m تطفو معدل الطفرة بين التسلسلات المرجعية والقراءات [0.001]

-d FILE حدد ملفًا يحتوي على سطر واحد من تسلسل 3'-adaptor
[باطل]

-u FILE تفريغ القراءات غير المعينة والقراءة التي تحتوي على أكثر من nmis يتطابق مع
ملف منفصل [فارغ]

-e INT حد مجموع الصفات الأساسية غير المتطابقة [70]

-H FILE تفريغ عدة مرات / عدم تطابق 01 إلى FILE [باطل]

-C INT الحد الأقصى لعدد مرات الوصول إلى الإخراج. غير محدود إذا كان أكبر من 512. [250]

-M c⎪g وضع محاذاة مثيلة. سيكون كل C (أو G) على الخيط الأمامي
تغيرت إلى T (أو A). هذا الخيار للاختبار فقط.

-N تخزين موضع عدم التطابق في ملف الإخراج خارج الخريطة. عندما
الخيار قيد الاستخدام ، الحد الأقصى لطول القراءة المسموح به هو 55 نقطة أساس.

NOTE:

* يجب تحضير قراءات النهاية المزدوجة في ملفين ، واحد لكل نهاية ، مع
يتم فرز القراءات بنفس الترتيب. هذا يعني القراءة من k في الأول
يتم تزاوج الملف مع قراءة k في الملف الثاني. القراءة المقابلة
يجب أن تكون الأسماء متطابقة حتى النهاية "/ 1" أو "/ 2". على سبيل المثال ، مثل ملف
يُسمح بزوج من الأسماء المقروءة: "EAS1_1_5_100_200 / 1" و
"EAS1_1_5_100_200 / 2". عادةً ما يتم إنشاء المخلفات "/ [12]" بواسطة
GAPipeline للتمييز بين الطرفين في زوج.

* الإخراج عبارة عن ملف ثنائي مضغوط. يتأثر بالأنانية.

* أفضل طريقة لتشغيل هذا الأمر هي توفير ما يقرب من 1 إلى 3 ملايين قراءة
إدخال. المزيد من القراءات تستهلك المزيد من الذاكرة.

* اختيار -n يتحكم في حساسية المحاذاة. بشكل افتراضي ، يتم النقر مع
يمكن العثور دائمًا على ما يصل إلى 2 من حالات عدم التطابق. أعلى -n يجد المزيد من الزيارات وأيضًا
يحسن دقة تعيين الصفات. ومع ذلك ، يتم ذلك على حساب التكلفة
السرعة.

* يجب تجاهل عمليات المحاذاة التي تحتوي على العديد من حالات عدم التطابق عالية الجودة باعتبارها زائفة
محاذاة أو تلوثات محتملة. يتم التحكم في هذا السلوك عن طريق الخيار
-e. -e يتم حساب العتبة تقريبًا لأن الصفات الأساسية
مقسومة على 10 في مرحلة معينة من المحاذاة. ال -Q الخيار في
تجمع قم بتعيين العتبة بدقة.

* يُقال أنه تم إقران زوج من القراءات بشكل صحيح إذا وفقط إذا كان ملف
التوجه FR والمسافة الخارجية للزوج ليست أكبر من
ماكسينز. لا يوجد حد أدنى لحجم الإدخال. هذا الإعداد
تم تحديده بواسطة خوارزمية محاذاة النهاية المزدوجة المستخدمة في Maq. تتطلب أ
سيؤدي حجم الإدخال الأدنى إلى بعض المحاذاة الخاطئة بدرجة عالية
صفات رسم الخرائط المبالغة في تقديرها.

* حاليًا ، تتم قراءة أزواج القراءة من مكتبة الإدخال الطويل Illumina / Solexa
اتجاه. يتم تعيين الحد الأقصى لحجم الإدخال بواسطة الخيار -A. ومع ذلك ، طويل-
يتم أيضًا دمج مكتبة الإدراج مع جزء صغير من قراءة الإدخال القصير
أزواج. -a يجب أيضًا تعيينه بشكل صحيح.

* في بعض الأحيان قد يتم تسلسل 5'-end أو حتى تسلسل 3'-adaptor بأكمله.
توفير -d يجعل Maq للقضاء على تلوث المحول.

* بالنظر إلى 2 مليون قراءة كمدخلات ، ماك عادة ما يستغرق 800 ميغا بايت من الذاكرة.

مابميرج ماك مابميرج خارج الخريطة خريطة in.aln1 خريطة in.aln2 [...]

دمج مجموعة من محاذاة القراءة معًا.

NOTE:

* من الناحية النظرية ، يمكن لهذا الأمر دمج عدد غير محدود من المحاذاة. ولكن كما
سيقرأ mapmerge جميع المدخلات في نفس الوقت ، وقد يصل إلى ملف
الحد الأقصى لعدد الملفات المفتوحة التي حددها نظام التشغيل. في الوقت الحاضر ، هذا
يجب حلها يدويًا بواسطة المستخدمين النهائيين.

* أمر مابميرج يمكن استخدامها لدمج ملفات المحاذاة بقراءات مختلفة
أطوال. لم تعد جميع التحليلات اللاحقة تفترض طولًا ثابتًا.

com.rmdup ماك com.rmdup خريطة out.rmdup in.ori.map

قم بإزالة الأزواج ذات الإحداثيات الخارجية المتطابقة. من حيث المبدأ ، أزواج مع
يجب أن تحدث إحداثيات خارجية متطابقة نادرًا. ومع ذلك ، بسبب
التضخيم في تحضير العينة ، يحدث هذا بشكل متكرر أكثر من بواسطة
صدفة. تظهر التحليلات العملية أن إزالة التكرارات تساعد في تحسين
الدقة الشاملة لاستدعاء SNP.

تجمع ماك تجمع [] [-m ماكسميس] [-Q ماكسير] [-r هتر] [-t coef] [-q دقيقة] [-N
nHap] out.cns in.ref.bfa in.aln.map 2> out.cns.log

استدعاء تسلسل الإجماع من قراءة الخرائط.

والخيارات:

-t تطفو معامل تبعية الخطأ [0.93]

-r تطفو جزء من الزيجوت متغايرة الزيجوت بين جميع المواقع [0.001]

-s خذ جودة رسم الخرائط ذات النهاية الواحدة باعتبارها جودة رسم الخرائط النهائية ؛
وإلا سيتم استخدام جودة تعيين النهاية المقترنة

-p تجاهل قراءات النهاية المزدوجة التي لم يتم تعيينها في أزواج صحيحة

-m INT الحد الأقصى لعدد حالات عدم التطابق المسموح بها لاستخدام القراءة فيها
الاتصال بالإجماع [7]

-Q INT أقصى مجموع مسموح به لقيم الجودة للقواعد غير المتطابقة [60]

-q INT يسمح الحد الأدنى من جودة الخرائط لاستخدام القراءة بالإجماع
الاتصال [0]

-N INT عدد الأنماط الفردانية في التجمع (> = 2) [2]

NOTE:

* اختيار -Q يضع حدًا أقصى لمجموع الصفات الأساسية غير المتطابقة.
يجب التخلص من القراءات التي تحتوي على العديد من حالات عدم التطابق عالية الجودة.

* اختيار -N يحدد عدد أنماط الفرد في التجمع. تم تصميمه ل
إعادة ترتيب العينات عن طريق تجميع سلالات / أفراد متعددة معًا. ل
إعادة تسلسل الجينوم ثنائي الصبغة ، هذا الخيار يساوي 2.

جلفجين ماك جلفجين [] [-m ماكسميس] [-Q ماكسير] [-r هتر] [-t coef] [-q دقيقة] [-N
nHap] out.cns in.ref.bfa in.aln.map 2> out.cns.log

احسب احتمالية تسجيل جميع الأنماط الجينية وتخزين النتائج في تنسيق GLF
(تنسيق احتمالية التنميط الجيني). يرجى مراجعة موقع MAQ للحصول على التفاصيل
أوصاف تنسيق الملف والأدوات المساعدة ذات الصلة.

إينديلب ماك إينديلب in.ref.bfa in.aln.map > out.indelpe

قم باستدعاء indels المتسقة من قراءات النهاية المزدوجة. الإخراج هو TAB محدد بـ
كل سطر يتكون من كروموسوم ، موضع البداية ، نوع الإنديل ، الرقم
من القراءات عبر indel ، وحجم indel والنيوكليوتيدات المدرجة / المحذوفة
(مفصولة بنقطتين) ، عدد indels على الشريط العكسي ، عدد indels
على الشريط الأمامي ، 5 'تسلسل قبل indel ، 3' التسلسل التالي
indel ، عدد القراءات المحاذاة بدون indels وثلاثة أعمدة إضافية
للمرشحات.

في العمود الثالث ، نوع indel ، تشير النجمة إلى تأكيد indel
من خلال القراءة من كلا الجدولين ، تعني علامة الجمع أن indel قد تم ضربه بقراءتين على الأقل
ولكن من نفس الخيط ، يظهر الطرح أن indel موجود فقط في قراءة واحدة ،
وتعني النقطة أن indel قريب جدًا من indel آخر ويتم تصفيته.

يُنصح المستخدمون بتشغيل "maq.pl indelpe" لتصحيح عدد
يقرأ تعيين بدون indels. لمزيد من التفاصيل ، راجع "maq.pl indelpe"
والقسم الخاص به.

إينديلسوا ماك إينديلسوا in.ref.bfa in.aln.map > out.indelsoa

استدعاء indels متماثلة اللواقح المحتملة ونقاط الانكسار من خلال الكشف عن غير طبيعي
نمط المحاذاة حول indels ونقاط الانكسار. الإخراج هو أيضًا TAB
محدد مع كل سطر يتكون من كروموسوم ، تنسيق تقريبي ،
طول المنطقة غير الطبيعية ، عدد القراءات المعينة عبر الموضع ،
عدد القراءات على الجانب الأيسر من الموضع وعدد القراءات على
على الجانب الأيمن. يمكن تجاهل العمود الأخير.

يحتوي الإخراج على العديد من الإيجابيات الخاطئة. يمكن أن يكون المرشح الموصى به:

awk '$ 5 + $ 6- $ 4> = 3 && $ 4 <= 1' in.indelsoa

لاحظ أن هذا الأمر لا يهدف إلى أن يكون كاشفًا دقيقًا ، ولكن
يساعد بشكل أساسي على تجنب بعض الإيجابيات الخاطئة في الاتصال البديل. في
بالإضافة إلى ذلك ، فإنه يعمل بشكل جيد فقط مع الأخذ في الاعتبار العمق العميق (~ 40X على سبيل المثال) ؛ وإلا فإن
سيكون المعدل السلبي الخاطئ مرتفعًا جدًا.

شكل التحول

sol2sanger ماك sol2sanger in.sol.fastq out.sanger.fastq

قم بتحويل Solexa FASTQ إلى تنسيق قياسي / Sanger FASTQ.

bfq2fastq ماك bfq2fastq في قراءة خارج. قراءة

قم بتحويل تنسيق BFQ الخاص بـ Maq إلى تنسيق FASTQ القياسي.

Mapass2maq ماك Mapass2maq خريطة 2 خارج. maq خريطة

قم بتحويل تنسيق خريطة mapass2 القديم إلى تنسيق خريطة Maq. الشكل القديم يفعل
لا تحتوي على أسماء للقراءة.

معلومات استخراج

عرض الخريطة ماك عرض الخريطة [-بن] in.aln.map > out.aln.txt

اعرض محاذاة القراءة في نص عادي. لقراءات محاذاة قبل سميث-
محاذاة Waterman ، يتكون كل سطر من اسم القراءة ، والكروموسوم ، والموضع ،
حبلا ، حجم الإدخال من الزوايا الخارجية للزوج ، العلم المقترن ، رسم الخرائط
الجودة ، وجودة الخرائط أحادية النهاية ، وجودة الخرائط البديلة ، وعدد
عدم التطابق بين أفضل النتائج ، مجموع صفات القواعد غير المتطابقة للأفضل
hit ، عدد مرات عدم التطابق 0 لأول 24 نقطة أساس ، عدد مرات عدم التطابق 1 من
أول 24 نقطة أساس في المرجع وطول القراءة وتسلسل القراءة وتسلسلها
جودة. جودة الخرائط البديلة تساوي دائمًا جودة الخرائط إذا كان
لم يتم إقران القراءات. إذا تم إقران القراءات ، فإنها تساوي التعيين الأصغر
جودة الطرفين. هذه الجودة البديلة لرسم الخرائط هي في الواقع
تعيين جودة زوج غير طبيعي.

العمود الخامس ، العلم المقترن ، هو علم أحادي الاتجاه. تعطي بتات 4 السفلية
الاتجاه: 1 يرمز إلى FF و 2 لـ FR و 4 لـ RF و 8 لـ RR حيث يعني FR
أن القراءة ذات الإحداثيات الأصغر موجودة على الشريط الأمامي ، ورفيقها كذلك
على الشريط العكسي. يسمح فقط بالفرنسية للزوج الصحيح. البتات الأعلى
من هذا العلم إعطاء مزيد من المعلومات. إذا التقى الزوج بالنهاية المزدوجة
الشرط ، سيتم تعيين 16. إذا تم تعيين القرائتين إلى مختلف
الكروموسومات ، سيتم تعيين 32. إذا تعذر تعيين إحدى القرائتين على الإطلاق ،
سيتم تعيين 64. دائمًا ما يساوي علم الزوج الصحيح 18.

للقراءات المحاذاة بواسطة محاذاة Smith-Waterman بعد ذلك ، يكون العلم
دائمًا 130. يتكون السطر من اسم القراءة ، والكروموسوم ، والموضع ، والحبلة ، والإدراج
الحجم ، العلم (130 دائمًا) ، موضع indel في القراءة (0 إذا لم يكن هناك indel) ،
طول indels (موجب للإدخالات وسالب للحذف) ،
تعيين جودة رفيقه ، عدد حالات عدم التطابق في أفضل نتيجة ، مجموع
صفات القواعد غير المتطابقة لأفضل ضربة ، صفرين ، طول القراءة ،
قراءة التسلسل وجودته. دائمًا ما يحصل رفيق القراءة ذات 130 علامة على علامة
العلم 18.

تشير العلامة 192 إلى أنه لم يتم تعيين القراءة ولكن تم تعيين رفيقها. لمثل هذا
زوج قراءة ، قراءة واحدة بها علم 64 والأخرى بها 192.

والخيارات:

-b لا تعرض تسلسل القراءة والجودة

-N اعرض المواضع التي تحدث فيها حالات عدم التطابق. هذا العلم يعمل فقط
بملف خرائط تم إنشاؤه بواسطة "maq map -N".

الخريطة ماك الخريطة [-s] [-m ماكسميس] [-q دقيقة] in.ref.bfa in.aln.map > خارج الخريطة

اقرأ فحص الجودة. يقوم Mapcheck أولاً بالإبلاغ عن تكوين وعمق
المرجع. بعد ذلك هناك شكل. يشير العمود الأول إلى ملف
موقف على القراءة. بعد أربعة أعمدة تظهر النوكليوتيدات
التكوين ، سيتم إعطاء معدلات الاستبدال بين المرجع والقراءات.
يتم قياس هذه المعدلات والأرقام الموجودة في الأعمدة التالية إلى 999 و
مقربة إلى أقرب عدد صحيح. تظهر المجموعة التالية من الأعمدة توزيع
الصفات الأساسية على طول القراءات في فاصل جودة من 10. تدهور في الجودة
يمكن ملاحظتها عادةً ، مما يعني أن القواعد في نهاية القراءة أقل
دقيق. تمثل المجموعة الأخيرة من الأعمدة جزء الاستبدالات لـ
قراءة القواعد في فترة جودة. هذا يقيس دقة الجودة الأساسية
تقدير. من الناحية المثالية ، نتوقع أن نرى 1 في 3؟ العمود ، 10 في 2؟ عمودي
و 100 في 1؟ عمودي.

والخيارات:

-s خذ جودة رسم الخرائط ذات النهاية الواحدة باعتبارها جودة رسم الخرائط النهائية

-m INT الحد الأقصى لعدد حالات الخطأ في القراءة المسموح بها لحساب قراءة [4]

-q INT الحد الأدنى من جودة التعيين المسموح به لحساب القراءة [30]

يجمع ماك يجمع [-SPVP] [-m ماكسميس] [-Q ماكسير] [-q دقيقة] [-l ملف الموقع] in.ref.bfa
in.aln.map > out.pilup

اعرض المحاذاة بتنسيق نص "تراكمي". كل سطر يتكون من
الكروموسوم والموضع والقاعدة المرجعية والعمق والأسس على يقرأ هذا الغلاف
هذه الوضعية. لو -v يضاف إلى سطر الأوامر والصفات الأساسية والتخطيط
الصفات سيتم عرضها في العمودين السادس والسابع بالترتيب.

يبدأ العمود الخامس دائمًا بـ "@". في هذا العمود ، اقرأ القواعد المتطابقة
إلى المرجع في فاصلة "أو" نقطة "." ، وقراءة القواعد بشكل مختلف
من المرجع في الحروف. تشير الفاصلة أو الأحرف الكبيرة إلى أن القاعدة
يأتي من قراءة محاذاة على الشريط الأمامي ، بينما يتم وضع نقطة أو أحرف صغيرة
الشريط العكسي.

هذا الأمر مخصص للمستخدمين الذين يرغبون في تطوير متصلين SNP الخاصين بهم.

والخيارات:

-s خذ جودة رسم الخرائط ذات النهاية الواحدة باعتبارها جودة رسم الخرائط النهائية

-p تجاهل قراءة النهاية المزدوجة التي لم يتم تعيينها كأزواج صحيحة

-v إخراج معلومات مطولة بما في ذلك الصفات الأساسية والتخطيط
الصفات

-m INT الحد الأقصى لعدد حالات عدم التطابق المسموح باستخدامها للقراءة [7]

-Q INT العدد الأقصى المسموح به لقيم الجودة لعدم التطابق [60]

-q INT الحد الأدنى من جودة التعيين المسموح به للقراءة لاستخدامها [0]

-l FILE ملف يحتوي على المواقع التي سيتم طباعة pileup فيها. في هذا
ملف يعطي العمود الأول أسماء المرجع والثاني
الاحداثيات. سيتم تجاهل الأعمدة الإضافية. [باطل]

-P أيضا إخراج الموضع الأساسي على القراءة

cns2fq ماك cns2fq [-Q minMapQ] [-n دقيقة] [-d عمق دقيقة] [-D أقصى عمق] in.cns >
out.cns.fastq

استخرج تسلسلات الإجماع بتنسيق FASTQ. في تسلسل الخطوط والقواعد
في الحالة الصغيرة تكون مكررة بشكل أساسي أو ليس لديها تغطية كافية ؛ القواعد
تشير الأحرف الكبيرة إلى المناطق التي يمكن فيها تسمية النيوكلوتايد بشكل موثوق به. في ال
خطوط الجودة ، ASCII للحرف ناقص 33 يعطي جودة PHRED.

والخيارات:

-Q INT الحد الأدنى من جودة رسم الخرائط [40]

-d INT عمق القراءة الأدنى [3]

-n INT الحد الأدنى من الجودة المجاورة [20]

-D INT أقصى قراءة dpeth. > = 255 لعدد غير محدود. [255]

cns2snp ماك cns2snp in.cns > out.snp

استخراج مواقع SNP. يتكون كل سطر من كروموسوم وموضع وقاعدة مرجعية
قاعدة الإجماع ، جودة الإجماع الشبيهة بـ Phred ، عمق القراءة ، متوسط ​​عدد
عدد مرات القراءة التي تغطي هذا الموضع ، وهي أعلى جودة في رسم الخرائط للقراءات
تغطية الموقف ، الحد الأدنى من جودة الإجماع في 3bp المرافقة
المناطق في كل جانب من الموقع (إجمالي 6 نقاط أساس) ، ثاني أفضل مكالمة ، سجل
نسبة احتمالية ثاني أفضل مكالمة وثالث أفضل مكالمة وثالث أفضل مكالمة
مكالمة.

العمود الخامس هو المعيار الأساسي عندما تحكم على موثوقية SNP.
ومع ذلك ، نظرًا لأن هذه الجودة يتم حسابها فقط على افتراض استقلالية الموقع ، فأنت
يجب أيضًا مراعاة الأعمدة الأخرى للحصول على مكالمات SNP أكثر دقة. النصي
أمر ``maq.pl مرشح SNPتم تصميمه لهذا (انظر أدناه).

يشير العمود السابع إلى ما إذا كان الموقع يقع في منطقة متكررة. إذا كان الجواب لا
قراءة تغطي الموقع يمكن تعيينها بجودة عالية لرسم الخرائط ، والإحاطة
من المحتمل أن تكون المنطقة متكررة أو تفتقر إلى قراءات جيدة. SNP في مثل هذا الموقع
عادة لا يمكن الاعتماد عليها.

يعطي العمود الثامن تقريبًا رقم نسخة المنطقة المحيطة في
الجينوم المرجعي. في معظم الحالات ، يقترب هذا الرقم من 1.00 ، مما يعني أن
المنطقة فريدة من نوعها. في بعض الأحيان قد ترى عمق قراءة غير صفري ولكن 0.00 في
العمود السابع. يشير هذا إلى أن جميع القراءات التي تغطي المركز لها في
اثنين على الأقل من حالات عدم التطابق. يحسب Maq فقط عدد مرات عدم التطابق 0 و 1
المرجع. هذا بسبب مشكلة فنية معقدة.

يعطي العمود التاسع الجودة المجاورة. التصفية في هذا العمود هي أيضا
المطلوبة للحصول على SNPs موثوق بها. هذه الفكرة مستوحاة من NQS ، على الرغم من NQS
صممت في البداية لقراءة واحدة بدلاً من الإجماع.

cns2view ماك cns2view in.cns > خارج

عرض معلومات مفصلة في جميع المواقع. تنسيق الإخراج مطابق لـ
cns2snp تقرير.

cns2ref ماك cns2ref in.cns > out.ref.fasta

استخرج التسلسل المرجعي.

cns2win ماك cns2win [-w يفوز] [-c مركز حقوق الإنسان] [-b بدأ] [-e النهاية] [-q دقيقة] in.cns >
خارج الفوز

استخراج المعلومات في المتوسط ​​في نافذة الحراثة. الإخراج هو TAB محدد ،
الذي يتكون من اسم مرجعي ، تنسيق مقسومًا على 1,000,000 ، معدل SNP ،
معدل Ht ، وعمق القراءة الخام ، وعمق القراءة في مناطق فريدة تقريبًا ، و
متوسط ​​عدد الزيارات للقراءات في النافذة ونسبة GC.

والخيارات:

-w INT حجم النافذة [1000]

-c STR تسلسل مرجعي مقصود وإلا سيتم استخدام جميع المراجع
[باطل]

-b INT موضع البدء ، 0 بدون قيود [0]

-e INT الموضع النهائي ، 0 لعدم وجود قيود [0]

-q INT الحد الأدنى من الإجماع على جودة المواقع التي سيتم استخدامها [0]

محاكاة مقالات ذات صلة

com.fakemut ماك com.fakemut [-r موترات] [-R إينديلفراك] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

أدخل الاستبدالات و indels بشكل عشوائي إلى المرجع. بدائل و
يمكن إضافة indels sinlge الأساسي.

والخيارات:

-r تطفو معدل الطفرة [0.001]

-R تطفو جزء من الطفرات ليكون indels [0.1]

سيموترين ماك سيموترين out.simupars.dat in.read.fastq

تقدير / تدريب المعلمات لمحاكاة القراءة.

محاكاة ماك محاكاة [-d في الحجم] [-s com.stdev] [-N يقرأ] [-1 readLen1] [-2 readLen2] [-r
معدل] [-R indelfrac] [-h] خارج .read1.fastq خارج .read2.fastq in.ref.fasta
in.simupars.dat

محاكاة قراءات النهاية المزدوجة. ملف in.simupars.dat يحدد أطوال القراءة و
توزيع الجودة. تم إنشاؤه من سيموترين، أو يمكن تنزيله من
موقع مق. في ملفات قراءة الإخراج ، يتكون اسم القراءة من المرجع
اسم التسلسل والإحداثيات الخارجية للزوج من القراءات المحاكاة. بواسطة
إفتراضي، محاكاة يفترض أن القراءات تأتي من تسلسل ثنائي الصيغة الصبغية يتم إنشاؤه
عن طريق إضافة مجموعتين مختلفتين من الطفرات ، بما في ذلك الزوج الأساسي indels ، إلى
in.ref.fasta.

والخيارات:

-d INT متوسط ​​المسافة الخارجية لأحجام الإدخال [170]

-s INT الانحراف المعياري لأحجام الإدخال [20]

-N INT عدد القراءات الزوجية التي سيتم إنشاؤها [1000000]

-1 INT طول أول قراءة [ضبط بواسطة in.simupars.dat]

-2 INT طول القراءة الثانية [تعيين بواسطة in.simupars.dat]

-r تطفو معدل الطفرة [0.001]

-R تطفو جزء من 1bp indels [0.1]

-h إضافة كل الطفرات إلى in.ref.fasta وتوليد قراءات من الفردي
تسلسل متحور (وضع أحادي الصيغة الصبغية)

NOTE:

* القراءات الناتجة عن هذا الأمر مستقلة ، والتي تنحرف عن
حقيقة. في حين أن تقييم التوافق هو أقل تأثرا بهذا ، فإن التقييم على
يجب إجراء مكالمات SNP بحذر. تبعية الخطأ قد تكون واحدة من
الأسباب الرئيسية لمكالمات SNP الخاطئة.

سموستات ماك سموستات in.simu-aln.map > خارج

تقييم تعيين الصفات من القراءات المحاكاة.

صلب مقالات ذات صلة

fasta2csfa ماك fasta2csfa in.nucl-ref.fasta > out.color-ref.fasta

تحويل النوكليوتيدات FASTA إلى FASTA ذات الترميز اللوني. علم -c يجب أن يتم تطبيقه بعد ذلك
إلى رسم خريطة أمر. في الإخراج ، يشير الحرف "A" إلى اللون 0 ، و "C" إلى 1 ، و "G"
لـ 2 و "T" لـ 3. يكون كل تسلسل في الإخراج أقصر بمقدار 1 بت في الإخراج من الإدخال.

com.csmap2nt ماك com.csmap2nt خريطة خارج in.ref.nt.bfa in.cs.map

تحويل محاذاة اللون إلى محاذاة النوكليوتيدات. المدخل in.ref.nt.bfa هل
النوكليوتيدات ملف مرجعي ثنائي FASTA. يجب أن يتوافق مع الملف الأصلي
الذي يتم تحويل مرجع اللون منه. يمكن استدعاء إجماع النوكليوتيدات
من المحاذاة الناتجة.

متفرقات / متقدم أوامر

سوباب ماك سوباب [-q minMapQ] [-Q maxSumErr] [-m ماكس مم] [-p] خارج الخريطة في الخريطة

قم بتصفية المحاذاة السيئة بتنسيق في الخريطة. تم وصف خيارات سطر الأوامر في ملف
`تجمع' أمر.

eland2maq ماك eland2maq [-q ناقص] خارج الخريطة في قائمة في أرض

تحويل محاذاة eland إلى تنسيق خريطة maq. ملف في قائمة يتكون من
أسماء التسلسل التي تظهر في العمود السابع من ملف محاذاة Eland
في أرض والاسم الذي تتوقع رؤيته في محاذاة maq. ما يلي هو
مثال:

cX.fa chrX
c1.fa chr1
c2.fa chr2

إذا كنت تقوم بمحاذاة القراءات على دفعات متعددة باستخدام eland ، فمن المهم أن تقوم بذلك
استخدم نفس الشيء في قائمة للتحويل. بالإضافة إلى ذلك ، سيتم تحميل maq جميع ملفات
المحاذاة وفرزها في الذاكرة. إذا كان لديك سلسلة عدة eland
إلى ملف ضخم واحد ، يجب فصله إلى ملفات أصغر إلى
منع maq من أكل كل ذاكرة جهازك.

يهدف هذا الأمر في الواقع إلى إظهار محاذاة Eland في Maqview. كما لا جودة
المعلومات المتاحة ، يجب عدم استخدام ملف محاذاة maq الناتج
للاتصال بالأنماط الجينية المتفق عليها.

import2maq ماك import2maq [-1 read1len] [-2 read2len] [-a com.maxdist] [-n] خارج الخريطة في قائمة
في التصدير

قم بتحويل تنسيق تصدير Illumina إلى تنسيق Maq .خريطة صيغة. تنسيق التصدير هو ملف
تنسيق المحاذاة منذ SolexaPipeline-0.3.0 والذي يحسب أيضًا التعيين
صفات مثل maq. يمكن استخدام الملف الناتج للاتصال بالأنماط الجينية المتفق عليها
حيث أن معظم المعلومات الضرورية متوفرة لـ Maq للقيام بذلك بدقة.

والخيارات:

-1 INT طول القراءة الأولى [0]

-2 INT طول القراءة الثانية [0]

-a INT أقصى مسافة خارجية لزوج قراءة صحيح [250]

-n الاحتفاظ بالقراءات المصفاة

ماك بيرل أوامر


عرض maq.pl عرض [-h] [-s] [-N ن أزواج] [-d outdir] in.fasta في السمودات

شرح استخدام ماك والنصوص المصاحبة له. هذا الأمر سوف
يقرأ محاكاة من ملف FASTA in.fasta. طول التسلسل والصفات
يتم تحديدها بواسطة في السمودات الذي تم إنشاؤه من ماك سيموترين أو يمكن أن يكون
تم تنزيله من موقع Maq. سيتم بعد ذلك تعيين القراءات المحاكاة باستخدام
maq.pl com.easyrun. يتم تقييم دقة المحاذاة بواسطة ماك سموستاتأطلقت حملة
دقة توافق الآراء ماك سيموسنس، ودقة SNP بواسطة maq_eval.pl.

بشكل افتراضي ، ستتم محاكاة قراءات النهاية المزدوجة وسيتم استخدام تسلسل ثنائي الصيغة الصبغية
المتولدة من المدخلات عن طريق إضافة طفرات إلى أي نوع أحادي الصيغة الصبغية. الملحق
يتم التحكم في حجم ومعدل الطفرة ماك محاكاة.

والخيارات:

-h محاكاة تسلسل أحادي الصيغة الصبغية بدلاً من تسلسل ثنائي الصيغة الصبغية

-s استخدم الوضع أحادي النهاية لمحاذاة القراءات بدلاً من وضع النهاية المزدوجة

-N INT عدد القراءات الزوجية التي سيتم محاكاتها [1000000]

-d DIR دليل الإخراج [maqdemo]

NOTE:

* ملفات الإخراج من maq_eval.pl لم يتم توثيقها ، ولكن يمكنك القيام بذلك
تخمين جيد في بعض هذه الملفات.

* يوضح هذا الأمر فقط استخدام جناح maq. الدقة الحقيقية
تكون البيانات دائمًا تقريبًا أقل مما تراه من المحاكاة البحتة.

com.easyrun maq.pl com.easyrun [-1 قراءة] [-d out.dir] [-n يقرأ] [-A 3 محول] [-e دقيقة]
[-q دقيقةCnsQ] [-p] [-2 قراءة] [-a maxIns] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]

تحليل خط أنابيب الجينوم الصغير. سيقوم الأمر Easyrun بتشغيل معظم التحليلات
تنفذ في ماك. بشكل افتراضي، com.easyrun يفترض كل تسلسلات قراءة الإدخال
الملفات أحادية الطرف ومستقلة ؛ متي -p تم تحديد تسلسل قراءة اثنين
الملفات مطلوبة ، واحدة لكل نهاية.

سيتم إنشاء عدة ملفات بتنسيق out.dir، من بينها الملفات التالية
الخرج الرئيسي:

cns.final.snp تم تصفية مكالمات SNP النهائية ذات الجودة المنخفضة

cns.fq متواليات الإجماع والصفات بتنسيق FASTQ

والخيارات:

-d DIR دليل الإخراج [easyrun]

-n INT عدد القراءات / الأزواج في دفعة واحدة من المحاذاة [2000000]

-S تطبيق تحليل القراءة المنقسمة على indels القصيرة (ربما بطيئًا جدًا)

-N INT عدد الأنماط الفردانية / السلالات في البركة (> = 2) [2]

-A FILE ملف 3'- محول. يجب أن يحتوي الملف على سطر واحد من التسلسل
[باطل]

-1 INT طول القراءة الأولى ، 0 للتلقائي [0]

-e INT الحد الأدنى لعمق القراءة المطلوب لاستدعاء SNP (لتصفية SNP) [3]

-q INT الحد الأدنى من جودة الإجماع لـ SNPs في cns.final.snp [30]

-p قم بالتبديل إلى وضع محاذاة النهاية المقترنة

-2 INT طول القراءة الثانية عندما -p يتم تطبيقه [0]

-a INT الحد الأقصى لحجم الإدخال عندما -p يتم تطبيقه [250]

الملاحظات:

* لاستدعاء SNP على العينات المجمعة ، يجب على المستخدمين تعيين الصحيح `-N' إلى جانب
`-E 0.

* يمكن أن يكون ملف الإدخال بتنسيق maq الثنائي. maq.pl سوف يكتشف تلقائيا
تنسيق الملف.

مرشح SNP maq.pl مرشح SNP [-d دقيقة] [-D ماكس ديب] [-Q maxMapQ] [-q دقيقةCnsQ] [-w
indelWinSize] [-n دقيقة] [-F in.indelpe] [-f in.indelsoa] [-s الحد الأدنى من النقاط] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinSize] in.cns2snp.snp >
out.filtered.snp

استبعد SNPs التي تمت تغطيتها بقراءات قليلة (المحددة بواسطة -d) ، بعدد كبير جدًا
يقرأ (محدد بواسطة -D) ، قريب (محدد بواسطة -w) إلى indel ، السقوط
في منطقة متكررة محتملة (تتميز ب -Q) ، أو ذات جودة منخفضة
القواعد المجاورة (المحددة بواسطة -n). إذا maxWinSNP أو أكثر من النيوكلوتايد في أي
densWinSize نافذة ، سيتم أيضًا تصفيتهما معًا.

والخيارات:

-d INT الحد الأدنى لعمق القراءة المطلوب لاستدعاء SNP [3]

-D INT الحد الأقصى لعمق القراءة المطلوب لاستدعاء SNP (<255 ، وإلا تم تجاهله)
[256]

-Q INT الجودة القصوى المطلوبة لرسم الخرائط للقراءات التي تغطي SNP [40]

-q INT الحد الأدنى من جودة الإجماع [20]

-n INT الحد الأدنى من توافق الآراء المتجاورة [20]

-w INT حجم النافذة حول indels المحتملة. تعدد الأشكال المتقاربة
إلى indels سيتم قمعها [3]

-F FILEإينديلب الإخراج [فارغ]

-f FILEإينديلسوا الإخراج [فارغ]

-s INT يجب اعتبار الحد الأدنى من النقاط للحصول على شهادة SOA-indel [3]

-m INT أقصى عدد من القراءات التي يمكن تعيينها عبر soa-indel [1]

-a مرشح بديل لمحاذاة طرف واحد

إينديلب maq.pl إينديلب in.indelpe > out.indelpe

قم بتصحيح عدد القراءات التي تم تعيينها بدون indels لمسارات البوليمر المتجانس. هذه
الأمر بتعديل الأعمدة الرابع والعاشر والأعمدة الثلاثة الأخيرة من in.indelpe و
إخراج النتيجة في out.indelpe. بعد التصحيح ، ما يلي AWK
يعطي الأمر indels المفترضة متماثلة اللواقح:

awk '($ 3 == "*" ⎪⎪ $ 3 == "+") && $ 6 + $ 7> = 3 && ($ 6 + $ 7) / $ 4> = 0.75'

وما يلي يعطي الزيجوت متغايرة الزيجوت:

awk '($ 3 == "*" ⎪⎪ $ 3 == "+") && $ 6 + $ 7> = 3 && ($ 6 + $ 7) / $ 4 <0.75'

يرجى ملاحظة أن هذا إينديلب الأمر فقط يطبق عدة قواعد إرشادية.
وهو لا يصحح بالنسبة للخطوط غير النقية للبوليمر المتجانس أو ثنائي النوكليوتيد / ثلاثي
يعيد. وبالتالي ، فإن الأمرين awk يعطيان فقط hom / het تقريبيًا
إينديلز.

أمثلة


البرنامج النصي Easyrun:
maq.pl easyrun -d easyrun المرجع.فاستا الجزء 1. fastq part2.fastq

أوامر المفتاح وراء easyrun:
maq fasta2bfa المرجع fasta المرجع bfa ؛
maq fastq2bfq جزء 1. fastq part1.bfq ؛
maq fastq2bfq جزء 2. fastq part2.bfq ؛
maq map part1.map map ref.bfa part1.bfq؛
maq map part2.map map ref.bfa part2.bfq؛
maq mapmerge aln.map part1.map part2.map؛
maq تجميع cns.cns المرجع bfa aln.map ؛

استخدم موقع maq عبر الإنترنت باستخدام خدمات onworks.net


خوادم ومحطات عمل مجانية

قم بتنزيل تطبيقات Windows و Linux

  • 1
    عنيد
    عنيد
    تم نقل مشروع الدعامة إلى
    https://strace.io. strace is a
    التشخيص والتصحيح والتعليمي
    userpace tracer لنظام التشغيل Linux. يتم استخدامها
    لرصد ...
    تحميل strace
  • 2
    gMKV استخراج واجهة المستخدم الرسومية
    gMKV استخراج واجهة المستخدم الرسومية
    واجهة المستخدم الرسومية لأداة mkvextract (جزء من
    MKVToolNix) الذي يتضمن معظم (if
    ليس كل) وظائف mkvextract و
    المرافق mkvinfo. مكتوب بلغة C # NET 4.0 ، ...
    تنزيل gMKVExtractGUI
  • 3
    مكتبة جاسبر ريبورتس
    مكتبة جاسبر ريبورتس
    مكتبة JasperReports هي مكتبة
    المصدر المفتوح الأكثر شهرة في العالم
    ذكاء الأعمال وإعداد التقارير
    محرك. هو مكتوب بالكامل بلغة جافا
    وهي قادرة على ...
    تحميل مكتبة JasperReports
  • 4
    كتب فرابيه
    كتب فرابيه
    Frappe Books هو مصدر مجاني ومفتوح
    برنامج حفظ كتب سطح المكتب
    بسيطة ومصممة جيدًا ليتم استخدامها من قبل
    الشركات الصغيرة والعاملين لحسابهم الخاص. هو - هي'...
    تنزيل كتب فرابيه
  • 5
    عدد بايثون
    عدد بايثون
    الأخبار: NumPy 1.11.2 هو الإصدار الأخير
    التي سيتم إجراؤها على سورس فورج. عجلات
    لنظام التشغيل Windows و Mac و Linux كذلك
    يمكن أن تكون توزيعات المصدر المؤرشفة لـ ...
    تنزيل Numerical Python
  • 6
    CMU أبو الهول
    CMU أبو الهول
    CMUSphinx هو مكبر صوت كبير مستقل
    المفردات التعرف المستمر على الكلام
    صدر تحت رخصة نمط BSD. أنه
    أيضا مجموعة من الأدوات مفتوحة المصدر ...
    تحميل CMU Sphinx
  • أكثر "

أوامر لينكس

Ad