انگلیسیفرانسویاسپانیایی

Ad


فاویکون OnWorks

maq - آنلاین در ابر

maq را در ارائه دهنده هاست رایگان OnWorks از طریق Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا کنید.

این دستور maq است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


Maq - نقشه برداری و مونتاژ با کیفیت

خلاصه


Maq فرمان [گزینه های] استدلال

maq.pl فرمان [گزینه های] استدلال

شرح


Maq نرم افزاری است که مجموعه های نقشه برداری را از خواندن های کوتاه تولید شده توسط بعدی می سازد.
ماشین های توالی یابی نسل این به ویژه برای Illumina-Solexa 1G Genetic طراحی شده است
آنالایزر، و دارای یک عملکرد اولیه برای رسیدگی به داده های AB SOLiD است.

با Maq می توانید:

· تراز کردن سریع Illumina/SOLiD با ژنوم مرجع. با گزینه های پیش فرض، یک
میلیون جفت خواندن را می توان در حدود 10 ساعت CPU با کمتر به ژنوم انسان ترسیم کرد
از حافظه 1G

· اندازه گیری دقیق احتمال خطای تراز هر فرد خوانده شده.

· ژنوتیپ های توافقی، از جمله پلی مورفیسم های هموزیگوت و هتروزیگوت را با
یک کیفیت احتمالی Phred اختصاص داده شده به هر پایه.

· Indels کوتاه با خوانده شده پایان زوج پیدا کنید.

· حذف ها و جابجایی های ژنومی در مقیاس بزرگ را با قرائت انتهایی جفتی به دقت پیدا کنید.

· CNV های بالقوه را با بررسی عمق خواندن کشف کنید.

· ارزیابی دقت کیفیت های پایه خام از ترتیب دهنده ها و کمک به بررسی
خطاهای سیستماتیک

با این حال، ماق می تواند نه:

· انجام دادن de جدید مونتاژ. (Maq فقط می تواند با نگاشت خواندن به یک شناخته شده اجماع را فراخوانی کند
مرجع.)

· شورت نقشه بر علیه خودشان می خواند. (Maq فقط می تواند همپوشانی کامل بین خواندن پیدا کند.)

· قرائت های مویرگی یا 454 خوانده شده را با مرجع تراز کنید. (Maq نمی تواند بیشتر از آن خوانده شود
63bp.)

MAQ دستورات


کلید دستورات

fasta2bfa Maq fasta2bfa in.ref.fasta out.ref.bfa

توالی ها را با فرمت FASTA به فرمت Maq's BFA (باینری FASTA) تبدیل کنید.

fastq2bfq Maq fastq2bfq [-n nreads] in.read.fastq out.read.bfqout.پیشوند

خواندن در قالب FASTQ را به فرمت Maq's BFQ (FASTQ باینری) تبدیل کنید.

گزینه ها:

-n INT تعداد خوانده شده در هر فایل [مشخص نشده]

نقشه Maq نقشه [-n nmis] [-a حداکثر] [-c] [-1 len1] [-2 len2] [-d adap3] [-m جهش کردن]
[-u بدون نقشه] [-e ماکسر] [-M c⎪g] [-N] [-H allhits] [-C maxhits] out.aln.map
in.ref.bfa in.read1.bfq [in.read2.bfq] 2> out.map.log

نقشه به دنباله های مرجع می خواند.

گزینه ها:

-n INT تعداد حداکثر عدم تطابق که همیشه می توان یافت [2]

-a INT حداکثر فاصله بیرونی برای یک جفت خواندن صحیح [250]

-A INT حداکثر فاصله بیرونی دو RF پرداخت شده (0 برای غیرفعال کردن) [0]

-c خواندن نقشه در فضای رنگی (فقط برای SOLID)

-1 INT طول خواندن برای اولین خواندن، 0 برای خودکار [0]

-2 INT طول خواندن برای دومین خواندن، 0 برای خودکار [0]

-m شناور نرخ جهش بین دنباله های مرجع و خوانده شده [0.001]

-d فایل یک فایل حاوی یک خط منفرد از دنباله آداپتور 3 را مشخص کنید
[خالی]

-u فایل خواندن های نقشه برداری نشده و خوانده های حاوی بیش از nmis عدم تطابق به
یک فایل جداگانه [null]

-e INT آستانه بر روی مجموع کیفیت های پایه ناسازگار [70]

-H فایل تخلیه چندگانه/همه بازدیدهای عدم تطابق 01 به فایل [خالی]

-C INT حداکثر تعداد بازدید برای خروجی نامحدود اگر بزرگتر از 512 باشد. [250]

-M c⎪g حالت هم ترازی متیلاسیون. تمام C (یا G) در رشته جلو خواهد بود
به T (یا A) تغییر یافت. این گزینه فقط برای تست است.

-N موقعیت عدم تطابق را در فایل خروجی ذخیره کنید out.aln.map. وقتی این
گزینه در حال استفاده است، حداکثر طول خواندن مجاز 55bp است.

توجه:

* قرائت های پایانی زوجی باید در دو فایل، یکی برای هر انتها، با
خوانده ها به همان ترتیب مرتب شده اند. این به معنای k-امین خوانده شده در اول است
فایل با k-امین خوانده شده در فایل دوم جفت می شود. مربوطه خوانده شود
نام ها باید تا باطله «/1» یا «/2» یکسان باشند. به عنوان مثال، چنین
جفت نام خوانده شده مجاز است: «EAS1_1_5_100_200/1» و
"EAS1_1_5_100_200/2". tailing '/[12] معمولاً توسط
GAPipeline برای تشخیص دو سر در یک جفت.

* خروجی یک فایل باینری فشرده است. تحت تأثیر endianness است.

* بهترین راه برای اجرای این دستور ارائه حدود 1 تا 3 میلیون خواندن به عنوان است
ورودی خواندن بیشتر حافظه بیشتری مصرف می کند.

* گزینه -n حساسیت تراز را کنترل می کند. به طور پیش فرض، یک ضربه با
تا 2 عدم تطابق را می توان همیشه پیدا کرد. بالاتر -n بازدیدهای بیشتری پیدا می کند و همچنین
دقت کیفیت های نقشه برداری را بهبود می بخشد. با این حال، این کار با هزینه انجام می شود
از سرعت

* ترازهایی با بسیاری از عدم تطابق با کیفیت بالا باید به عنوان نادرست کنار گذاشته شوند
ترازها یا آلودگی های احتمالی این رفتار توسط گزینه کنترل می شود
-e. -e آستانه فقط به دلیل کیفیت های پایه تقریباً محاسبه می شود
در مرحله خاصی از تراز بر 10 تقسیم می شوند. در -Q گزینه در
مونتاژ دستور دقیقاً آستانه را تنظیم کنید.

* گفته می شود که یک جفت خوانده شده به درستی جفت شوند اگر و فقط در صورتی
جهت گیری است FR و فاصله بیرونی جفت بزرگتر از
حداکثر. هیچ محدودیتی در حداقل اندازه درج وجود ندارد. این تنظیم است
توسط الگوریتم هم ترازی انتهای جفتی استفاده شده در Maq تعیین می شود. نیاز به الف
حداقل اندازه درج منجر به ترازهای اشتباه با مقدار زیاد می شود
کیفیت های نقشه برداری بیش از حد برآورد شده است.

* در حال حاضر، جفت‌های خواندن از کتابخانه Illumina/Solexa با درج طولانی دارای RF خواندن هستند.
گرایش. حداکثر اندازه درج توسط گزینه تنظیم می شود -A. با این حال، طولانی
کتابخانه درج نیز با بخش کوچکی از خواندن درج کوتاه ترکیب شده است
جفت. -a همچنین باید به درستی تنظیم شود.

* گاهی اوقات ممکن است 5'-end یا حتی کل دنباله آداپتور 3' توالی شوند.
ارائه -d Maq را برای از بین بردن آلودگی های آداپتور ارائه می کند.

* با توجه به 2 میلیون خواندن به عنوان ورودی، Maq معمولا 800 مگابایت حافظه مصرف می کند.

ادغام نقشه Maq ادغام نقشه out.aln.map in.aln1.map in.aln2.map [...]

دسته ای از ترازهای خوانده شده را با هم ادغام کنید.

توجه:

* در تئوری، این دستور می تواند تعداد نامحدودی از ترازها را ادغام کند. با این حال، همانطور که
mapmerge همه ورودی‌ها را همزمان می‌خواند، ممکن است ضربه بزند
محدودیت حداکثر تعداد فایل های باز که توسط سیستم عامل تنظیم شده است. در حال حاضر، این
باید به صورت دستی توسط کاربران نهایی حل شود.

* فرمان ادغام نقشه می تواند برای ادغام فایل های تراز با خواندن های مختلف استفاده شود
طول ها تمام تحلیل های بعدی دیگر طول ثابتی را در نظر نمی گیرند.

rmdup Maq rmdup out.rmdup.map in.ori.map

جفت هایی با مختصات بیرونی یکسان را حذف کنید. در اصل، جفت با
مختصات بیرونی یکسان به ندرت اتفاق می افتد. با این حال، با توجه به
تقویت در آماده سازی نمونه، این اتفاق بسیار بیشتر از توسط
شانس. فرصت. تجزیه و تحلیل های عملی نشان می دهد که حذف موارد تکراری به بهبود آن کمک می کند
دقت کلی تماس SNP

مونتاژ Maq مونتاژ [-sp] [-m حداکثر] [-Q ماکسر] [-r هترات] [-t گوساله] [-q دقیقه] [-N
nHap] out.cns in.ref.bfa in.aln.map 2> out.cns.log

دنباله های اجماع را از نقشه خواندن فراخوانی کنید.

گزینه ها:

-t شناور ضریب وابستگی خطا [0.93]

-r شناور کسری از هتروزیگوت ها در بین همه سایت ها [0.001]

-s کیفیت نقشه برداری تک انتهایی را به عنوان کیفیت نقشه برداری نهایی در نظر بگیرید.
در غیر این صورت از کیفیت نگاشت انتهای جفتی استفاده خواهد شد

-p خواندن های پایانی جفت شده را که به صورت جفت درست نگاشت نشده اند، کنار بگذارید

-m INT حداکثر تعداد عدم تطابق مجاز برای استفاده از خواندن
فراخوان اجماع [7]

-Q INT حداکثر مجموع مجاز مقادیر کیفی مبانی نامتناسب [60]

-q INT حداقل کیفیت نگاشت مجاز برای خواندن به صورت توافقی
تماس با [0]

-N INT تعداد هاپلوتیپ ها در استخر (>=2) [2]

توجه:

* گزینه -Q محدودیتی را برای حداکثر مجموع کیفیت های پایه عدم تطابق تعیین می کند.
مطالب خواندنی حاوی بسیاری از عدم تطابق با کیفیت بالا باید کنار گذاشته شوند.

* گزینه -N تعداد هاپلوتیپ ها را در یک استخر تنظیم می کند. برای طراحی شده است
توالی‌یابی مجدد نمونه‌ها با ادغام چندین سویه/فرد با هم. برای
توالی ژنوم دیپلوئید، این گزینه برابر با 2 است.

glfgen Maq glfgen [-sp] [-m حداکثر] [-Q ماکسر] [-r هترات] [-t گوساله] [-q دقیقه] [-N
nHap] out.cns in.ref.bfa in.aln.map 2> out.cns.log

محاسبه احتمال ورود به سیستم برای همه ژنوتیپ ها و ذخیره نتایج در قالب GLF
(فرمت احتمال ژنوتیپ). لطفاً وب سایت MAQ را برای جزئیات بیشتر بررسی کنید
توضیحات فرمت فایل و ابزارهای مرتبط.

indelpe Maq indelpe in.ref.bfa in.aln.map > out.indelpe

ایندل های ثابت را از خوانده های پایانی جفت شده فراخوانی کنید. خروجی با TAB مشخص شده است
هر خط متشکل از کروموزوم، موقعیت شروع، نوع ایندل، تعداد
از خواندن در سراسر ایندل، اندازه ایندل و نوکلئوتیدهای درج شده/حذف شده
(با کولون از هم جدا می شوند)، تعداد ایندل ها در رشته معکوس، تعداد ایندل ها
در رشته رو به جلو، دنباله 5' جلوتر از ایندل، 3' دنباله بعدی
indel، تعداد خوانده‌های تراز شده بدون ایندل و سه ستون اضافی
برای فیلترها

در ستون 3، نوع ایندل، یک ستاره نشان می دهد که ایندل تایید شده است
با خواندن از هر دو رشته، یک پلاس به این معنی است که ایندل با حداقل دو بار خواندن ضربه می خورد
اما از همان رشته، یک منهای نشان می دهد که indel فقط در یک خواندن یافت می شود،
و نقطه به این معنی است که ایندل خیلی به ایندل دیگر نزدیک است و فیلتر شده است.

به کاربران توصیه می شود برای تصحیح تعداد از «maq.pl indelpe» استفاده کنند
نقشه برداری شده را بدون ایندل می خواند. برای جزئیات بیشتر، به "maq.pl indelpe" مراجعه کنید
بخش.

indelsoa Maq indelsoa in.ref.bfa in.aln.map > بیرون.indelsoa

با تشخیص غیر طبیعی، ایندل های هموزیگوت بالقوه و نقاط شکست را فراخوانی کنید
الگوی تراز در اطراف ایندل ها و نقاط شکست. خروجی نیز TAB است
با هر خط متشکل از کروموزوم، مختصات تقریبی، محدود شده است.
طول ناحیه غیرعادی، تعداد خوانش های نقشه برداری شده در سراسر موقعیت،
تعداد خوانده شده در سمت چپ موقعیت و تعداد خوانده شده در
سمت راست ستون آخر را می توان نادیده گرفت.

خروجی حاوی بسیاری از موارد مثبت کاذب است. یک فیلتر توصیه شده می تواند:

awk '$5+$6-$4 >= 3 &&$4 <= 1' in.indelsoa

توجه داشته باشید که هدف این دستور این نیست که یک آشکارساز دقیق ایندل باشد، بلکه
عمدتاً به جلوگیری از برخی موارد مثبت کاذب در فراخوانی جایگزین کمک می کند. که در
علاوه بر این، فقط با توجه به عمق عمیق (به عنوان مثال 40 برابر) به خوبی کار می کند. در غیر این صورت
نرخ منفی کاذب بسیار بالا خواهد بود.

قالب در حال تبدیل

sol2sanger Maq sol2sanger in.sol.fastq out.sanger.fastq

Solexa FASTQ را به فرمت استاندارد/Sanger FASTQ تبدیل کنید.

bfq2fastq Maq bfq2fastq in.read.bfq out.read.fastq

فرمت BFQ Maq را به فرمت استاندارد FASTQ تبدیل کنید.

mapass2maq Maq mapass2maq in.mapass2.map out.maq.map

فرمت نقشه منسوخ mapass2 را به قالب نقشه Maq تبدیل کنید. قالب قدیمی انجام می دهد
شامل نام های خوانده شده نیست

اطلاعات استخراج

نقشه نمای Maq نقشه نمای [-bN] in.aln.map > out.aln.txt

تراز خوانده شده را در متن ساده نمایش دهید. برای خواندن های تراز شده قبل از اسمیت-
تراز واترمن، هر خط شامل نام خوانده شده، کروموزوم، موقعیت،
رشته، اندازه درج از همبسته های بیرونی یک جفت، پرچم جفت، نقشه برداری
کیفیت، کیفیت نقشه برداری تک پایان، کیفیت نقشه برداری جایگزین، تعداد
عدم تطابق بهترین ضربه، مجموع کیفیت های پایه های نامتناسب بهترین ها
ضربه، تعداد ضربه های 0-ناهمخوانی 24bp اول، تعداد ضربه های 1-ناهمخوانی از
24bp اول در مرجع، طول خواندن، دنباله خواندن و آن
کیفیت کیفیت نقشه‌برداری جایگزین همیشه با کیفیت نقشه‌برداری برابر است
خوانده ها جفت نمی شوند. اگر خوانده ها جفت شوند، برابر با نقشه کوچکتر است
کیفیت دو سر این کیفیت نقشه برداری جایگزین در واقع همان است
کیفیت نگاشت یک جفت غیرعادی

ستون پنجم، پرچم جفت شده، یک پرچم بیتی است. 4 بیت پایین آن را می دهد
جهت: 1 مخفف FF، 2 برای FR، 4 برای RF، و 8 برای RR، که در آن FR به معنای
که خوانده شده با مختصات کوچکتر روی رشته جلو است و جفت آن است
در رشته معکوس فقط FR برای یک جفت صحیح مجاز است. بیت های بالاتر
از این پرچم اطلاعات بیشتری ارائه دهید. اگر جفت با انتهای جفت ملاقات کرد
شرط، 16 تعیین خواهد شد. اگر این دو خوانده شده با یکدیگر نگاشت شده باشند
کروموزوم، 32 تنظیم خواهد شد. اگر یکی از دو خواندن اصلاً قابل ترسیم نباشد،
64 تنظیم خواهد شد. پرچم برای یک جفت صحیح همیشه برابر با 18 است.

برای خواندن های تراز شده توسط تراز اسمیت-واترمن پس از آن، پرچم است
همیشه 130. یک خط از نام خوانده شده، کروموزوم، موقعیت، رشته، درج تشکیل شده است
اندازه، پرچم (همیشه 130)، موقعیت ایندل در مورد خوانده شده (0 اگر ایندل وجود ندارد)،
طول ایندل ها (مثبت برای درج ها و منفی برای حذف ها)،
کیفیت نقشه برداری جفت آن، تعداد عدم تطابق بهترین ضربه، مجموع
کیفیت پایه های نامتناسب بهترین ضربه، دو صفر، طول خواندن،
دنباله خواندن و کیفیت آن جفت یک 130 پرچم خوانده همیشه یک می گیرد
پرچم 18.

پرچم 192 نشان می دهد که خوانده شده نگاشت نشده است اما جفت آن نگاشت شده است. برای چنین
یک جفت خوانده شده، یکی خوانده شده دارای پرچم 64 و دیگری دارای 192 است.

گزینه ها:

-b دنباله خواندن و کیفیت را نمایش ندهید

-N نمایش موقعیت هایی که عدم تطابق در آنها رخ می دهد. این پرچم فقط کار می کند
با یک فایل .map تولید شده توسط 'maq map -N'.

نقشه چک Maq نقشه چک [-s] [-m حداکثر] [-q دقیقه] in.ref.bfa in.aln.map > out.mapcheck

بررسی کیفیت را بخوانید. نقشه چک ابتدا ترکیب و عمق آن را گزارش می کند
مرجع پس از آن یک فرم وجود دارد. ستون اول نشان می دهد
موقعیت در خواندن چهار ستون زیر که نوکلئوتید را نشان می دهد
ترکیب، نرخ جایگزینی بین مرجع و خواندن داده خواهد شد.
این نرخ ها و اعداد در ستون های زیر به 999 و مقیاس بندی شده اند
گرد شده به نزدیکترین عدد صحیح گروه بعدی ستون ها توزیع را نشان می دهد
کیفیت پایه در امتداد می خواند در فاصله کیفیت 10. کاهش کیفیت
معمولاً قابل مشاهده است، به این معنی که پایه های انتهای خواندن کمتر است
دقیق. آخرین گروه از ستون ها کسری از جایگزینی را برای
خواندن پایه ها در یک فاصله کیفی این دقت کیفیت پایه را اندازه گیری می کند
برآورد کردن. در حالت ایده آل، ما انتظار داریم 1 در 3 را ببینیم؟ ستون، 10 در 2؟ ستون
و 100 در 1؟ ستون

گزینه ها:

-s کیفیت نقشه برداری تک انتهایی را به عنوان کیفیت نقشه برداری نهایی در نظر بگیرید

-m INT حداکثر تعداد اشتباهات مجاز برای شمارش خواندن [4]

-q INT حداقل کیفیت نقشه برداری مجاز برای شمارش خواندن [30]

انباشته شدن Maq انباشته شدن [-spvP] [-m حداکثر] [-Q ماکسر] [-q دقیقه] [-l فایل سایت] in.ref.bfa
in.aln.map > بیرون.انباشته شدن

هم ترازی را در قالب متنی "pileup" نمایش دهید. هر خط شامل
کروموزوم، موقعیت، پایه مرجع، عمق و پایه هایی که روی آن نوشته می شود
این موقعیت. اگر -v در خط فرمان، کیفیت های پایه و نگاشت اضافه می شود
کیفیت ها به ترتیب در ستون های ششم و هفتم ارائه خواهند شد.

ستون پنجم همیشه با «@» شروع می شود. در این ستون، پایه ها را یکسان بخوانید
به مرجع با کاما "،" یا نقطه "." نشان داده می شود و پایه های متفاوت خوانده می شود
از مرجع در حروف کاما یا حرف بزرگ نشان می دهد که پایه است
از یک خواندن تراز شده در رشته جلو، در حالی که یک نقطه یا یک حروف کوچک روی است
رشته معکوس

این دستور برای کاربرانی است که می خواهند تماس گیرندگان SNP خود را توسعه دهند.

گزینه ها:

-s کیفیت نقشه برداری تک انتهایی را به عنوان کیفیت نقشه برداری نهایی در نظر بگیرید

-p جفت‌هایی که به‌عنوان جفت‌های صحیح ترسیم نشده‌اند را کنار بگذارید

-v خروجی اطلاعات کامل از جمله کیفیت پایه و نقشه برداری
کیفیت

-m INT حداکثر تعداد عدم تطابق مجاز برای استفاده از خواندن [7]

-Q INT حداکثر تعداد مجاز مقادیر کیفیت عدم تطابق [60]

-q INT حداقل کیفیت نقشه برداری مجاز برای استفاده از خواندن [0]

-l فایل فایل حاوی سایت هایی که pileup در آنها چاپ می شود. در این
فایل ستون اول نام مرجع و ستون دوم را می دهد
مختصات ستون های اضافی نادیده گرفته خواهند شد. [خالی]

-P همچنین خروجی موقعیت پایه در خواندن

cns2fq Maq cns2fq [-Q minMapQ] [-n minNeiQ] [-d عمق دقیقه] [-D بیشترین عمق] in.cns >
out.cns.fastq

دنباله های اجماع را در قالب FASTQ استخراج کنید. در خطوط دنباله، پایه ها
در حروف کوچک اساساً تکرار می شوند یا پوشش کافی ندارند. پایه ها
در حروف بزرگ، مناطقی را که می توان SNP ها را به طور قابل اعتماد فراخوانی کرد، نشان می دهد. در
خطوط با کیفیت، ASCII یک کاراکتر منهای 33 کیفیت PHRED را می دهد.

گزینه ها:

-Q INT حداقل کیفیت نقشه برداری [40]

-d INT حداقل عمق خواندن [3]

-n INT حداقل کیفیت همسایه [20]

-D INT حداکثر عمق خواندن >=255 برای نامحدود. [255]

cns2snp Maq cns2snp in.cns > out.snp

استخراج سایت های SNP هر خط شامل کروموزوم، موقعیت، پایه مرجع،
پایه اجماع، کیفیت اجماع Phred مانند، عمق خواندن، تعداد متوسط
بازدید از خواندن این موقعیت را پوشش می دهد، بالاترین کیفیت نقشه برداری از خواندن
پوشش موقعیت، حداقل کیفیت اجماع در 3bp جناحی
مناطق در هر طرف سایت (در مجموع 6bp)، دومین تماس برتر، ورود
نسبت احتمال دوم بهترین و سومین بهترین تماس و سومین بهترین
زنگ زدن.

هنگام قضاوت در مورد قابلیت اطمینان یک SNP، ستون 5 معیار اصلی است.
با این حال، از آنجایی که این کیفیت فقط با فرض استقلال سایت محاسبه می شود، شما
همچنین باید ستون های دیگری را برای دریافت تماس های SNP دقیق تر در نظر بگیرید. اسکریپت
فرمان `maq.pl فیلتر SNP' برای این طراحی شده است (به زیر مراجعه کنید).

ستون 7 نشان می دهد که آیا سایت در یک منطقه تکراری قرار می گیرد یا خیر. اگر نه
خواندن پوشش سایت را می توان با کیفیت نقشه برداری بالا، در کنار هم ترسیم کرد
منطقه احتمالاً تکراری است یا در فقدان خواندن خوب است. یک SNP در چنین سایتی
معمولا قابل اعتماد نیست

ستون 8 تقریباً شماره کپی ناحیه کناری را نشان می دهد
ژنوم مرجع در بیشتر موارد، این عدد به 1.00 نزدیک می شود، که به معنای این است
منطقه در مورد منحصر به فرد است. گاهی اوقات ممکن است عمق خواندن غیر صفر اما 0.00 در را ببینید
ستون 7 این نشان می‌دهد که همه خوانش‌هایی که موقعیت را پوشش می‌دهند، در هستند
حداقل دو عدم تطابق Maq فقط تعداد ضربه های 0- و 1-عدم تطابق را به حساب می آورد
مرجع این به دلیل یک مشکل فنی پیچیده است.

ستون 9 کیفیت همسایه را می دهد. فیلتر روی این ستون نیز می باشد
برای دریافت SNP های قابل اعتماد مورد نیاز است. این ایده از NQS الهام گرفته شده است، اگرچه NQS چنین است
در ابتدا برای یک خواندن به جای اجماع طراحی شد.

cns2view Maq cns2view in.cns > out.view

نمایش اطلاعات دقیق در همه سایت ها فرمت خروجی یکسان است
cns2snp گزارش.

cns2ref Maq cns2ref in.cns > out.ref.fasta

دنباله مرجع را استخراج کنید.

cns2win Maq cns2win [-w برنده شدن] [-c CHR] [-b شروع] [-e پایان] [-q دقیقه] in.cns >
برنده شدن

استخراج اطلاعات به طور متوسط ​​در یک پنجره خاکورزی. خروجی با TAB مشخص است،
که شامل نام مرجع، مختصات تقسیم بر 1,000,000، نرخ SNP،
نرخ het، عمق خواندن خام، عمق خواندن در مناطق تقریبا منحصر به فرد،
میانگین تعداد بازدیدهای خوانده شده در پنجره و درصد GC.

گزینه ها:

-w INT اندازه یک پنجره [1000]

-c STR دنباله مرجع مقصد؛ در غیر این صورت از تمامی مراجع استفاده خواهد شد
[خالی]

-b INT موقعیت شروع، 0 بدون محدودیت [0]

-e INT موقعیت پایانی، 0 بدون محدودیت [0]

-q INT حداقل کیفیت اجماع سایت های مورد استفاده [0]

شبیه سازی مربوط

جعلی Maq جعلی [-r جهش کردن] [-R غیر قابل قبول] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

به طور تصادفی جایگزین ها و ایندل ها را به مرجع معرفی کنید. تعویض ها و
ایندل های جفت پایه sinlge را می توان اضافه کرد.

گزینه ها:

-r شناور نرخ جهش [0.001]

-R شناور کسری از جهش ها باید ایندل باشد [0.1]

سیموترین Maq سیموترین out.simupars.dat in.read.fastq

تخمین پارامترهای قطار برای شبیه سازی خواندن.

شبیه سازی Maq شبیه سازی [-d در اندازه] [-s stdev] [-N n می خواند] [-1 ReadLen1] [-2 ReadLen2] [-r
mutRate] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq in.ref.fasta
in.simupars.dat

قرائت پایان جفت شده را شبیه سازی کنید. فایل in.simupars.dat طول خوانده شده را تعیین می کند و
توزیع با کیفیت از تولید می شود سیموترین، یا می توان از آن دانلود کرد
وب سایت ماق. در فایل های خوانده شده خروجی، نام خوانده شده از مرجع تشکیل شده است
نام دنباله و مختصات بیرونی جفت قرائت های شبیه سازی شده. توسط
پیش فرض، شبیه سازی فرض می‌کند که خوانده‌ها از یک دنباله دیپلوئیدی می‌آیند که تولید می‌شود
با افزودن دو مجموعه مختلف جهش، از جمله یک جفت پایه ایندل، به
in.ref.fasta.

گزینه ها:

-d INT میانگین فاصله بیرونی اندازه های درج [170]

-s INT انحراف استاندارد اندازه های درج [20]

-N INT تعداد جفت خواندنی که باید ایجاد شود [1000000]

-1 INT طول اولین خواندن [تنظیم شده توسط in.simupars.dat]

-2 INT طول خواندن دوم [تنظیم شده توسط in.simupars.dat]

-r شناور نرخ جهش [0.001]

-R شناور کسری از 1bp ایندل [0.1]

-h همه جهش ها را به آن اضافه کنید in.ref.fasta و از تک آهنگ خوانده می شود
توالی جهش یافته (حالت هاپلوئید)

توجه:

* خواندن های تولید شده از این دستور مستقل هستند که از دستور منحرف می شود
حقیقت. در حالی که ارزیابی هم ترازی کمتر تحت تأثیر این قرار می گیرد، ارزیابی در
فراخوانی SNP باید با احتیاط انجام شود. وابستگی به خطا ممکن است یکی از این موارد باشد
دلایل اصلی تماس های اشتباه SNP

سیموستات Maq سیموستات in.simu-aln.map > خارج.simustat

کیفیت های نقشه برداری را از خوانش های شبیه سازی شده ارزیابی کنید.

جامد مربوط

fasta2csfa Maq fasta2csfa in.nucl-ref.fasta > out.colour-ref.fasta

نوکلئوتید FASTA را به FASTA با کد رنگی تبدیل کنید. پرچم -c سپس باید اعمال شود
به نقشه فرمان در خروجی، حرف "A" مخفف رنگ 0، "C" برای 1، "G" است.
برای 2 و 'T' برای 3. هر دنباله در خروجی 1bp کوتاهتر از ورودی است.

csmap2nt Maq csmap2nt out.nt.map in.ref.nt.bfa in.cs.map

تراز رنگ را به تراز نوکلئوتیدی تبدیل کنید. ورودی in.ref.nt.bfa هست
فایل مرجع FASTA باینری نوکلئوتیدی. باید با فایل اصلی مطابقت داشته باشد
که از آن مرجع رنگ تبدیل می شود. اجماع نوکلئوتیدی را می توان نامید
از هم ترازی حاصل

متفرقه/پیشرفته دستورات

نقشه فرعی Maq نقشه فرعی [-q minMapQ] [-Q maxSumErr] [-m حداکثر میلی متر] [-p] خارج از نقشه در نقشه

ترازهای بد را فیلتر کنید در نقشه. گزینه های خط فرمان در شرح داده شده است
`مونتاژ'فرمان.

eland2maq Maq eland2maq [-q دفکوال] خارج از نقشه در لیست in.eland

تراز eland را به فرمت maq.map تبدیل کنید. فایل در لیست متشکل از
نام های دنباله ای که در ستون هفتم فایل تراز eland ظاهر می شوند
in.eland و نامی که انتظار دارید در تراز maq ببینید. زیر یک است
مثال:

cX.fa chrX
c1.fa chr1
c2.fa chr2

اگر در حال تراز خواندن در چند دسته با استفاده از eland هستید، مهم است
از همان استفاده کنید در لیست برای تبدیل علاوه بر این، maq همه را بارگذاری می کند
ترازها و مرتب سازی آنها در حافظه. اگر چندین eland را به هم متصل کرده اید
خروجی را به یک فایل بزرگ تبدیل کنید، باید آن را به فایل های کوچکتر جدا کنید
از خوردن تمام حافظه دستگاه شما توسط maq جلوگیری کنید.

هدف این دستور در واقع نشان دادن تراز Eland در Maqview است. به عنوان بدون کیفیت
اطلاعات موجود است، فایل تراز maq حاصل نباید استفاده شود
برای نامیدن ژنوتیپ های اجماع.

export2maq Maq export2maq [-1 read1len] [-2 read2len] [-a ماکسدیست] [-n] خارج از نقشه در لیست
در صادرات

فرمت Export Illumina را به Maq تبدیل کنید .نقشه قالب فرمت صادرات جدید است
فرمت تراز از SolexaPipeline-0.3.0 که نقشه برداری را نیز محاسبه می کند
ویژگی هایی مانند maq فایل حاصل را می توان برای فراخوانی ژنوتیپ های اجماع استفاده کرد
زیرا اکثر اطلاعات لازم برای maq برای انجام دقیق این کار در دسترس است.

گزینه ها:

-1 INT طول اولین خواندن [0]

-2 INT طول خواندن دوم [0]

-a INT حداکثر فاصله بیرونی برای یک جفت خواندن صحیح [250]

-n خواندن های فیلتر شده را حفظ کنید

MAQ-PERL دستورات


نسخه ی نمایشی maq.pl نسخه ی نمایشی [-h] [-s] [-N nجفت] [-d outDir] in.fasta in.simudat

نشان دادن استفاده از Maq و اسکریپت های همراه آن این دستور خواهد بود
شبیه سازی خواندن از یک فایل FASTA in.fasta. طول دنباله و کیفیت
توسط تعیین می شوند in.simudat که از تولید می شود Maq سیموترین یا می تواند باشد
دانلود شده از سایت مق. سپس قرائت های شبیه سازی شده با آنها نگاشت می شوند
maq.pl easyrun. دقت تراز توسط ارزیابی می شود Maq سیموستاتاز
دقت اجماع توسط Maq simucnsو دقت SNP توسط maq_eval.pl.

به‌طور پیش‌فرض، خواندن‌های پایانی زوجی شبیه‌سازی می‌شوند و یک دنباله دیپلوئیدی شبیه‌سازی می‌شود
از ورودی با افزودن جهش به هر یک از انواع هاپلوئید تولید می شود. درج
اندازه و میزان جهش توسط کنترل می شود Maq شبیه سازی.

گزینه ها:

-h یک دنباله هاپلوئید را به جای دنباله دیپلوئید شبیه سازی کنید

-s از حالت تک پایانی برای تراز خواندن به جای حالت پایان جفتی استفاده کنید

-N INT تعداد جفت خواندن برای شبیه سازی [1000000]

-d DIR فهرست خروجی [maqdemo]

توجه:

* فایل های خروجی از maq_eval.pl مستند نشده اند، اما ممکن است بسازید
حدس خوبی در مورد برخی از این فایل ها.

* این دستور فقط استفاده از مجموعه maq را نشان می دهد. دقت در واقعی
داده ها تقریباً همیشه کمتر از چیزی است که از شبیه سازی خالص می بینید.

easyrun maq.pl easyrun [-1 read1Len] [-d out.dir] [-n n می خواند] [-A 3 آداپتور] [-e minDep]
[-q minCnsQ] [-p] [-2 read2Len] [-a maxIns] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]

خط لوله را برای ژنوم های کوچک تجزیه و تحلیل می کند. دستور Easyrun اکثر تحلیل ها را اجرا می کند
اجرا شده در Maq. به صورت پیش فرض، easyrun تمام توالی های خواندن ورودی را فرض می کند
فایل ها تک پایانی و مستقل هستند. چه زمانی -p مشخص شده است، دو دنباله خواندن
فایل مورد نیاز است، یکی برای هر پایان.

چندین فایل در آن تولید خواهد شد out.dirکه فایل های زیر از جمله آنهاست
خروجی کلید:

cns.final.snp تماس های نهایی SNP با تماس های با کیفیت پایین فیلتر شده است

cns.fq توالی ها و کیفیت های اجماع در قالب FASTQ

گزینه ها:

-d DIR فهرست خروجی [easyrun]

-n INT تعداد خوانده‌ها/جفت‌ها در یک دسته تراز [2000000]

-S اعمال تجزیه و تحلیل تقسیم‌خوانی ایندل‌های کوتاه (شاید بسیار کند)

-N INT تعداد هاپلوتیپ ها/ سویه ها در استخر (>=2) [2]

-A فایل فایل برای 3'-adapter. فایل باید شامل یک خط توالی باشد
[خالی]

-1 INT طول اولین خواندن، 0 برای خودکار [0]

-e INT حداقل عمق خواندن مورد نیاز برای فراخوانی یک SNP (برای SNPfilter) [3]

-q INT حداقل کیفیت اجماع برای SNP ها در cns.final.snp [30]

-p به حالت هم ترازی انتهای جفتی بروید

-2 INT طول خواندن دوم وقتی -p اعمال می شود [0]

-a INT حداکثر اندازه درج زمانی که -p اعمال می شود [250]

توجه:

* برای فراخوانی SNP بر روی نمونه‌های تلفیقی، کاربران باید « را درست تنظیم کنند-N' همچنین
`-E 0 '

* فایل ورودی می تواند فرمت باینری maq باشد. maq.pl به طور خودکار تشخیص خواهد داد
فرمت فایل

فیلتر SNP maq.pl فیلتر SNP [-d minDep] [-D maxDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F in.indelpe] [-f in.indelsoa] [-s minScore] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinSize] in.cns2snp.snp >
out.filtered.snp

SNPهایی را که با تعداد کمی خوانده شده پوشش داده شده اند حذف کنید (مشخص شده توسط -d)، توسط بسیاری از افراد
می خواند (مشخص شده توسط -D)، نزدیک (مشخص شده توسط -w) به یک ایندل بالقوه، افتادن
در یک منطقه تکراری احتمالی (با مشخصه -Q) یا بی کیفیت بودن
پایگاه های همسایه (مشخص شده توسط -n) اگر maxWinSNP یا تعداد بیشتری SNP در هر کدام ظاهر می شود
densWinSize پنجره، آنها نیز با هم فیلتر خواهند شد.

گزینه ها:

-d INT حداقل عمق خواندن مورد نیاز برای فراخوانی SNP [3]

-D INT حداکثر عمق خواندن مورد نیاز برای فراخوانی یک SNP (<255، در غیر این صورت نادیده گرفته می شود)
[256]

-Q INT حداکثر کیفیت نگاشت مورد نیاز قرائت‌هایی که SNP را پوشش می‌دهند [40]

-q INT حداقل کیفیت اجماع [20]

-n INT حداقل کیفیت اجماع مجاور [20]

-w INT اندازه پنجره در اطراف ایندل های بالقوه. SNP هایی که نزدیک هستند
به ایندل ها سرکوب خواهد شد [3]

-F فایل La indelpe خروجی [تهی]

-f فایل La indelsoa خروجی [تهی]

-s INT حداقل امتیاز برای soa-indel باید در نظر گرفته شود [3]

-m INT حداکثر تعداد خوانش هایی که می توان در یک soa-indel ترسیم کرد [1]

-a فیلتر جایگزین برای تراز تک انتهایی

indelpe maq.pl indelpe in.indelpe > out.indelpe

تعداد خوانش های نقشه برداری شده بدون ایندل برای تراکت های هموپلیمر را تصحیح کنید. این
دستور اصلاح ستون 4، 10 و سه ستون آخر in.indelpe و
خروجی نتیجه را در out.indelpe. پس از اصلاح موارد زیر بیدار
دستور Indels هموزیگوت فرضی می دهد:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

و موارد زیر هتروزیگوت می دهد:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

لطفا توجه داشته باشید که این indelpe فرمان فقط چندین قانون اکتشافی را اجرا می کند.
برای اجراهای هموپلیمر ناخالص یا دی نوکلئوتید/سه گانه درست نمی شود
تکرار می کند. در نتیجه، دو دستور awk فقط تقریبی hom/het را می دهند
ایندلز

مثال ها


· اسکریپت Easyrun:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· دستورات کلیدی در پشت easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq part1.fastq part1.bfq;
maq fastq2bfq part2.fastq part2.bfq;
maq map part1.map ref.bfa part1.bfq;
maq map part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
MAQ ASSEMBLE CNS.CNS Ref.BFA ALN.MAP ؛

با استفاده از خدمات onworks.net از maq آنلاین استفاده کنید


سرورها و ایستگاه های کاری رایگان

دانلود برنامه های ویندوز و لینوکس

  • 1
    تسمه
    تسمه
    پروژه strace منتقل شده است
    https://strace.io. strace is a
    تشخیصی، اشکال زدایی و آموزشی
    ردیاب فضای کاربران برای لینوکس. استفاده شده است
    برای نظارت بر یک ...
    دانلود strace
  • 2
    gMKVExtractGUI
    gMKVExtractGUI
    یک رابط کاربری گرافیکی برای ابزار mkvextract (بخشی از
    MKVToolNix) که بیشتر (اگر
    نه همه) عملکرد mkvextract و
    ابزارهای mkvinfo. نوشته شده در C#NET 4.0،...
    gMKVExtractGUI را دانلود کنید
  • 3
    کتابخانه JasperReports
    کتابخانه JasperReports
    کتابخانه JasperReports است
    محبوب ترین منبع باز جهان
    هوش تجاری و گزارشگری
    موتور به طور کامل به زبان جاوا نوشته شده است
    و قادر است ...
    کتابخانه JasperReports را دانلود کنید
  • 4
    کتاب های فراپه
    کتاب های فراپه
    Frappe Books یک منبع باز و رایگان است
    نرم افزار دسکتاپ حسابداری که
    ساده و به خوبی طراحی شده تا مورد استفاده قرار گیرد
    مشاغل کوچک و فریلنسرها. آی تی'...
    دانلود کتاب فراپه
  • 5
    پایتون عددی
    پایتون عددی
    اخبار: NumPy 1.11.2 آخرین نسخه است
    که در sourceforge ساخته خواهد شد. چرخ ها
    برای ویندوز، مک و لینوکس و همچنین
    توزیع های منبع بایگانی شده می تواند چهار ...
    پایتون عددی را دانلود کنید
  • 6
    CMU ابوالهول
    CMU ابوالهول
    CMUSphinx یک بزرگ مستقل از بلندگو است
    تشخیص دهنده گفتار پیوسته واژگان
    تحت مجوز سبک BSD منتشر شد. این است
    همچنین مجموعه ای از ابزارهای متن باز ...
    دانلود CMU Sphinx
  • بیشتر "

دستورات لینوکس

Ad