blasr - آنلاین در ابر

این دستور blasr است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


blasr - توالی های SMRT را به یک ژنوم مرجع نقشه برداری کنید.

خلاصه


blasr بام می خواند ژنوم.fasta -بام بیرون بیرون.بام

blasr می خواند.fasta ژنوم.fasta

blasr می خواند.fasta ژنوم.fasta -سا ژنوم.fasta.sa

blasr می خواند.bax.h5 ژنوم.fasta [-سا ژنوم.fasta.sa]

blasr می خواند.bax.h5 ژنوم.fasta -سا ژنوم.fasta.sa -maxScore -100 -minMatch 15 ...

blasr می خواند.bax.h5 ژنوم.fasta -سا ژنوم.fasta.sa -nproc 24 بیرون هم ترازی.خارج ...

شرح


blasr یک برنامه نقشه برداری خواندنی است که با خوشه بندی، خوانش ها را به موقعیت های یک ژنوم نشان می دهد
تطابق دقیق کوتاه بین خوانده شده و ژنوم، و امتیازدهی خوشه ها با استفاده از تراز.
مطابقت ها با جستجوی تمام پسوندهای خوانده شده در برابر ژنوم با استفاده از a ایجاد می شوند
آرایه پسوندی روش‌های زنجیره‌ای جهانی برای امتیازدهی خوشه‌های مسابقات استفاده می‌شود.

تنها ورودی های مورد نیاز برای blasr یک فایل خوانده شده و یک ژنوم مرجع است. این است
خواندن اطلاعات فیلترینگ بسیار مفید است و زمان اجرای نقشه برداری ممکن است کاهش یابد
اساساً زمانی که یک شاخص آرایه پسوندی از پیش محاسبه شده در دنباله مرجع باشد
مشخص شده.

اگرچه ممکن است خواندن در قالب FASTA ورودی باشد، ورودی توصیه شده فایل های PacBio BAM است
زیرا اینها حاوی اطلاعات ارزش کیفی هستند که در تراز استفاده می شود و تولید می کند
تشخیص نوع با کیفیت بالاتر اگرچه ترازها را می توان در قالب های مختلف خروجی گرفت،
فرمت خروجی توصیه شده PacBio BAM است. پشتیبانی از فایل های bax.h5 و plx.h5 خواهد بود
منسوخ. پشتیبانی از جداول منطقه برای فایل های h5 خواهد بود منسوخ.

وقتی شاخص آرایه پسوندی یک ژنوم مشخص نیست، آرایه پسوندی قبلا ساخته می شود
تولید تراز هنگامی که ژنوم بزرگ است (مثلا انسان) این ممکن است بسیار کند باشد.
بهتر است با استفاده از برنامه آرایه پسوندی یک ژنوم را از قبل محاسبه کنید اره ساز(1)، و
سپس آرایه پسوندی را در خط فرمان با استفاده از آن مشخص کنید -سا ژنوم.fa.sa.

پارامترهای اختیاری تقریباً به سه دسته تقسیم می شوند: کنترل روی لنگر،
امتیازدهی همترازی و خروجی

پارامترهای لنگر پیش‌فرض برای ژنوم‌های کوچک و نمونه‌های تا 5 درصد بهینه هستند.
انحراف از ژنوم مرجع پارامتر اصلی حاکم بر سرعت و حساسیت
هست -minMatch پارامتر. برای ترازهای ژنوم انسان، مقدار 11 یا بالاتر است
توصیه شده. ممکن است چندین روش برای سرعت بخشیدن به هم ترازی ها استفاده شود که به قیمت تمام می شود
احتمالا کاهش حساسیت

مناطقی که بیش از حد تکراری هستند ممکن است در طول نقشه برداری با محدود کردن تعداد نادیده گرفته شوند
نقشه های خوانده شده را با -maxAnchorsPerPosition گزینه. مقادیر بین 500 و
1000 در ژنوم انسان موثر است.

برای ژنوم های کوچک مانند ژنوم باکتری ها یا BAC ها، پارامترهای پیش فرض کافی است
برای حداکثر حساسیت و سرعت خوب.

OPTIONS


ورودی فایل ها

می خواند

بام می خواند
یک فایل PacBio BAM از خواندن. این ورودی ترجیحی است blasr
زیرا ارزش کیفیت غنی (درج، حذف و جایگزینی).
مقادیر کیفیت) اطلاعات حفظ می شود. کیفیت اضافی
اطلاعات تشخیص انواع و سرعت نقشه برداری را بهبود می بخشد.

می خواند.fasta
یک فایل چند فاستایی از خواندن، اگرچه هر فایل fasta ورودی معتبری است

می خواند.bax.h5|reads.plx.h5
قدیمی منسوخ فرمت خروجی SMRT می خواند.

input.fofn
فایل نام فایل ها

-سا پسوندArrayFile
از آرایه پسوند 'sa' برای تشخیص تطابق بین خوانده ها و موارد استفاده کنید
مرجع. آرایه پسوندی توسط the آماده شده است اره ساز(1) برنامه

-ctab برگ
جدولی از تعداد دوتایی که برای تخمین اهمیت تطابق استفاده می شود. این توسط
برنامه 'printTupleCountTable'. در حالی که به سرعت در حال تولید است،
اگر فراخوان های زیادی از blasr، پیش محاسبه ctab مفید است.

-regionTable جدول (منسوخ)
برای پوشاندن بخش های خوانده شده، در یک جدول منطقه خواندن در قالب HDF بخوانید.
اگر فقط یک فایل ورودی وجود داشته باشد، ممکن است یک جدول واحد باشد یا یک fofn. چه زمانی
یک جدول منطقه مشخص شده است، هر جدول منطقه در داخل reads.plx.h5 or
فایل های reads.bax.h5 نادیده گرفته می شوند.
(منسوخ) گزینه برای اصلاح می خواند.

اطلاعات کمکی در مورد زیر رشته های خوانده شده وجود دارد که در a ذخیره می شود
"جدول منطقه" برای هر فایل خوانده شده. از آنجا که HDF استفاده می شود، جدول منطقه ممکن است باشد
بخشی از فایل bax.h5 یا plx.h5. یا یک فایل جداگانه. خواندن پیوسته
رشته فرعی از الگو یک زیرخوانده است و هر خوانده شده ممکن است حاوی چندین باشد
زیرخوانده ها مرزهای زیرخوانده ها را می توان از جدول منطقه استنباط کرد
به طور مستقیم یا با تعریف مرزهای آداپتور. به طور معمول جداول منطقه
همچنین حاوی اطلاعاتی برای موقعیت مکانی مناطق با کیفیت بالا و پایین است
می خواند. خواندن های تولید شده توسط خواندن های جعلی از ZMW های خالی شروع با کیفیت بالایی دارند
مختصات برابر با پایان با کیفیت بالا، بدون خواندن قابل استفاده است.

-useccs
دنباله اجماع دایره ای (ccs) را تراز کنید، سپس ترازهای آن را گزارش کنید
ccs به پنجره ای که ccs به آن نگاشت شده است، می خواند. فقط ترازهای
زیرخوانده ها گزارش می شوند.

-useccsall
مشابه -useccs، با این تفاوت که همه زیرخوانده‌ها به‌جای اینکه فقط با هم تراز باشند
زیرخوان هایی که برای فراخوانی ccs استفاده می شوند. این شامل خواندن هایی می شود که فقط بخشی را پوشش می دهند
از الگو.

-useccsdenovo
اجماع دایره ای را تراز کنید و فقط تراز ccs را گزارش کنید
توالی.

-noSplitSubreads (غلط)
زیرخوان ها را در آداپتورها تقسیم نکنید. این معمولا فقط زمانی مفید است که
ژنوم در یک نسخه باز نشده از یک الگوی شناخته شده، و حاوی الگو-
دنباله adapter-reverse_template.

-نادیده گرفتن مناطق (غلط)
هر گونه اطلاعات در جدول منطقه را نادیده بگیرید.

-نادیده گرفتنHQRegions (غلط)
هر منطقه hq را در جدول منطقه نادیده بگیرید.
ترازها به گزارش

-bestn n (10)
بالا را گزارش کنید n ترازها

-hitPolicy (همه)
یک خط مشی برای درمان چندین بازدید از [همه، همه بهترین، تصادفی،
تصادفی ترین، سمت چپ ترین]

تمام گزارش همه ترازها

همه بهترین
همه ترازهای امتیازدهی یکسان را گزارش کنید.

تصادفی یک تراز تصادفی را گزارش کنید

تصادفی ترین
یک هم ترازی تصادفی را از چندین امتیاز به طور مساوی گزارش دهید
ترازها

سمت چپ
ترازبندی را گزارش کنید که بهترین امتیاز تراز را دارد و دارای امتیاز است
کوچکترین مختصات نقشه برداری در هر مرجع.

-placeRepeatsRandomly (غلط)
منسوخ! اگر درست باشد، معادل -hitPolicy تصادفی ترین.

دانه تصادفی (0)
بذر برای مولد اعداد تصادفی. به‌طور پیش‌فرض (0)، از زمان فعلی به عنوان seed استفاده کنید.

-noSortRefinedAlignments (غلط)
هنگامی که ترازهای نامزد ایجاد و از طریق پویایی پراکنده امتیازدهی می شوند
برنامه نویسی، آنها با استفاده از تراز محلی که به حساب می آید، دوباره امتیازدهی می شوند
پروفایل های مختلف خطا توسل بر اساس تراز محلی ممکن است تغییر کند
به ترتیبی که بازدیدها برگردانده می شوند.

-allowAdjacentIndels
در صورت مشخص شدن، درج یا حذف مجاور مجاز است. در غیر این صورت،
درج و حذف مجاور در یک عملیات ادغام می شوند. استفاده كردن
مقادیر کیفیت برای هدایت ترازهای زوجی ممکن است دیکته کند که هر چه بالاتر باشد
تراز احتمالی شامل درج ها یا حذف های مجاور است. جاری
ابزارهایی مانند GATK این اجازه را نمی دهند و بنابراین توسط آنها گزارش نمی شود
به طور پیش فرض
تولید فرمت و فایل ها

بیرون خارج (پایانه)
خروجی را بنویسید خارج.

-سام خروجی را با فرمت SAM بنویسید.

-m t اگر SAM چاپ نمی شود، خروجی تراز را تغییر دهید.

چه زمانی t است:

0 با اتصال نوکلئوتیدهای منطبق بر خروجی مانند انفجار چاپ کنید.

1 چاپ فقط خلاصه: امتیاز و پوز.

2 با فرمت Compare.xml چاپ کنید.

3 چاپ در قالب مبتذل (منسوخ).

4 یک نسخه جدولی طولانی تر از تراز را چاپ کنید.

5 در قالب قابل تجزیه ماشینی که توسط آن خوانده می شود چاپ کنید
compareSequences.py.

-سرتیتر
یک هدر را به عنوان اولین خط از فایل خروجی که محتویات را توصیف می کند چاپ کنید
از هر ستون

-titleTable برگ (خالی)
جدولی از عناوین دنباله مرجع بسازید. دنباله های مرجع هستند
شمارش شده با ردیف، 0,1،XNUMX، ... شاخص مرجع به صورت تراز چاپ می شود
نتایج به جای نام مرجع کامل. این باعث می شود خروجی مختصر باشد،
به خصوص هرگاه عناوین پرمخاطب در نام مرجع وجود داشته باشد.

-ناتراز پرونده
خروجی می خواند که با آنها هم تراز نیستند پرونده

- بریدن [هیچ|سخت|زیرخواندن|نرم] (هیچ یک)

فقط برای خروجی SAM/BAM از بدون/سخت/زیر نان/برش نرم استفاده کنید.

-printSAMQV (غلط)
مقادیر کیفیت را در خروجی SAM چاپ کنید.

-cigarUseSeqMatch (غلط)
رشته‌های سیگار سیگار در خروجی SAM/BAM از «=» و «X» برای نشان دادن تطابق دنباله استفاده می‌کنند.
و عدم تطابق به جای "M".
گزینه برای لنگر هم ترازی مناطق.

این بیشترین تاثیر را روی سرعت و حساسیت خواهد داشت.

-minMatch m (12)
حداقل طول بذر minMatch بالاتر، هم ترازی را سرعت می بخشد، اما کاهش می یابد
حساسیت

-maxMatch l (inf)
وقتی طول lcp رسید، نگاشت یک خوانده شده به ژنوم را متوقف کنید l. این هست
زمانی مفید است که پرس و جو بخشی از مرجع باشد، برای مثال وقتی
ساخت ترازهای زوجی برای مونتاژ de novo.

- حداکثر LCPL طول l (inf)
همان -maxMatch.

-maxAnchorsPerPosition m (10000)
اگر موقعیتی با بیشتر از آن مطابقت دارد، لنگرها را اضافه نکنید m مکانها در
هدف.

-advanceExactMatches E (0)
یک ترفند دیگر برای سرعت بخشیدن به هم ترازی ها با کبریت - لنگرهای کمتر.
به جای پیدا کردن لنگر بین خوانده شده و ژنوم در هر زمان
موقعیت در خواندن، زمانی که یک لنگر در موقعیت i در خواندن یافت می شود
طول L، موقعیت بعدی در خواندن برای یافتن لنگر در i+LE است. استفاده کنید
این در هنگام تراز کردن contigs از قبل مونتاژ شده است.

-nکاندیداها n (10)
ادامه دهید تا n نامزدهای بهترین هم ترازی مقدار زیادی از n خواهد
نگاشت آهسته به این دلیل که مراحل برنامه نویسی پویا آهسته تر به آن اعمال می شود
خوشه های بیشتری از لنگرها که می تواند یک مرحله محدود کننده سرعت در هنگام خواندن باشد
بسیار طولانی.

- هماهنگ (غلط)
همه زیرخوان‌های یک zmw (حفره) را به جایی که طولانی‌ترین زیرخوانده عبور کامل از آن است، نگاشت کنید
zmw تراز شد به. این نیاز به استفاده از جدول منطقه و مناطق hq دارد.
این گزینه فقط زمانی کار می کند که خواندن در قالب پایه یا پالس h5 باشد.

الگوی هماهنگ (زیر نان میانی)
یک زیرخوانده کامل از یک zmw را به عنوان الگو برای نگاشت هماهنگ انتخاب کنید.
longestsubread - استفاده از طولانی ترین گذر کامل subread mediansubread - استفاده از
متوسط ​​طول متوسط ​​زیرخوانی کامل عبور معمولی زیرنان - از دومین طولانی‌ترین کامل استفاده کنید
در صورتی که طول طولانی‌ترین زیرخوانده پاس کامل یک عدد پرت باشد

-fastMaxInterval (غلط)
جستجوی سریع حداکثر فواصل افزایشی به عنوان نامزدهای تراز. جستجو
به اندازه پیش فرض جامع نیست، اما بسیار سریعتر است.

-aggressiveIntervalCut (غلط)
در صورت وجود، به طور موافق، نامزدهای همسویی غیر امیدوارکننده را فیلتر کنید
حداقل یک نامزد امیدوار کننده اگر این گزینه روشن باشد، blasr is
احتمالاً ترازهای کوتاه عناصر ALU را نادیده می گیرد.

-fastSDP (غلط)
از یک الگوریتم اکتشافی سریع برای سرعت بخشیدن به برنامه نویسی پویا پراکنده استفاده کنید.
گزینه برای پالایش بازدید

-sdpTupleSize K (11)
از مسابقات طولی استفاده کنید K برای سرعت بخشیدن به ترازهای برنامه نویسی پویا این
دقت تخصیص شکاف ها در ترازهای زوجی را در یک نقشه برداری کنترل می کند
یافت شده است، به جای خود حساسیت نگاشت.

-scoreMatrix نمره ماتریس رشته
یک ماتریس امتیاز جایگزین برای به ثمر رساندن خواندن سریع مشخص کنید. ماتریس است
در قالب

ACGTN
یک ابجد
سی فغیج
جی کلمنو
تی پیقرست
N uvwxy

مقادیر a...y باید به عنوان یک رشته جدا شده با فاصله نقل قول وارد شوند: "abc
... y". امتیازات پایین تر بهتر است، بنابراین مسابقات باید کمتر از عدم تطابق باشد
به عنوان مثال a,g,m,s = -5 (تطابق)، عدم تطابق = 6.

-affineOpen ارزش (10)
جریمه را برای باز کردن یک تراز افین تعیین کنید.

-affineExtend a (0)
جریمه شکاف افین (توسعه) را تغییر دهید. مقدار کمتر باعث ایجاد شکاف های بیشتر می شود.
گزینه برای همپوشانی / پویا برنامه نویسی ترازها و به صورت جفتی همپوشانی برای de جدید
مونتاژ.

کیفیت استفاده (غلط)
از مقادیر کیفیت جایگزینی/درج/حذف/ادغام برای امتیاز دادن به شکاف و
عدم تطابق پنالتی ها در ترازهای زوجی زیرا درج و
نرخ حذف بسیار بالاتر از جایگزینی است، این باعث می شود بسیاری از آنها
ترازها به جای جایگزینی، درج/حذف را ترجیح می دهند. اجماع ساده لوحانه
متدهای فراخوانی اغلب پلی مورفیسم های جایگزینی را از دست می دهند. این گزینه
باید هنگام فراخوانی اجماع با استفاده از روش Quiver استفاده شود. علاوه بر این،
هنگامی که از مقادیر کیفیت برای امتیازدهی همترازها استفاده نمی شود، مقدار کمتری وجود خواهد داشت
دقت اجماع در مناطق همولیمر

-affineAlign (غلط)
تراز را با استفاده از تراز هدایت شونده affine اصلاح کنید.
گزینه برای فیلتر می خواند و ترازها

-minReadLength l (50)
از خواندن هایی که طول کامل آنها کمتر از l. ممکن است زیرخوان‌ها کوتاه‌تر باشند.

-minSubreadLength l (0)
زیرگروه هایی با طول کمتر از تراز نکنید l.

-minRawSubreadScore m (0)
زیرخوان هایی را که امتیاز کیفی آنها در جدول منطقه کمتر از آن است، تراز نکنید m
(نمرات کیفیت باید در محدوده [0، 1000] باشد).

-maxScore m (-200)
حداکثر امتیاز به خروجی (بالا بد است، منفی خوب).

-minAlnLength
(0) ترازها را فقط در صورتی گزارش کنید که طول آنها از minAlnLength بیشتر باشد.

-minPctSimilarity (0) ترازها را فقط در صورتی گزارش کنید که درصد تشابه آنها باشد
بیشتر از minPctSimilarity.

-minPctAccuracy
(0) ترازها را فقط در صورتی گزارش کنید که درصد دقت آنها بیشتر از
دقت min.
گزینه برای موازی هم ترازی

-nproc N (1)
تراز کردن با استفاده از N فرآیندها تمام ساختارهای داده بزرگ مانند آرایه پسوندی
و جدول شمارش تاپل به اشتراک گذاشته شده است.

-شروع S (0)
فهرست اولین خواندن برای شروع تراز. این زمانی مفید است که چندگانه باشد
نمونه‌ها روی داده‌های یکسانی اجرا می‌شوند، به‌عنوان مثال زمانی که روی یک رک چندگانه هستند
خوشه.

-گام های بلند برداشتن S (1)
هر بار یکی را تراز کنید S می خواند.
گزینه برای نمونه گیری فرعی می خواند.

-نمونه فرعی (0)
نسبت خوانده شده به نمونه فرعی تصادفی (بیان شده به صورت اعشاری) و
تراز کردن

-holeNumbers لیست
در صورت مشخص شدن، فقط قرائت هایی را تراز کنید که شماره سوراخ ZMW در آنها باشد لیست. لیست
رشته ای از محدوده های محدود شده با کاما است، مانند '1,2,3,10-13'. این گزینه
فقط زمانی کار می کند که خواندن در قالب bam، bax.h5 یا plx.h5 باشد.

-h چاپ اطلاعات راهنما

QUOTE


برای استناد به BLASR، لطفاً از: Chaisson MJ و Tesler G.، Mapping single molecule استفاده کنید.
توالی خواندن با استفاده از تراز محلی پایه با پالایش متوالی (BLASR): نظریه
and Application، BMC Bioinformatics 2012، 13:238.

با استفاده از خدمات onworks.net از blasr آنلاین استفاده کنید



جدیدترین برنامه های آنلاین لینوکس و ویندوز