این دستور fastx_barcode_splitter.pl است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
fastx_barcode_splitter.pl - تقسیم کننده بارکد FASTX
شرح
شکاف بارکد، اثر اساف گوردون ([ایمیل محافظت شده]، 11 سپتامبر 2008
این برنامه فایل FASTA/FASTQ را می خواند و آن را به چندین فایل کوچکتر تقسیم می کند
مطابقت بارکد داده های FASTA/FASTQ از خروجی STDIN خوانده می شود (قالب به صورت خودکار شناسایی می شود.)
فایل ها روی دیسک نوشته می شوند. خلاصه در STDOUT چاپ خواهد شد.
استفاده: r.pl --bcfile فایل -- پیشوند پیشوند [--پسوند پسوند] [--bol|--eol]
[--عدم تطابق N] [--دقیق] [--N جزئی] [--راهنما] [--آرام] [--اشکالزدایی]
استدلال ها:
--bcfile FILE - نام فایل بارکد. (توضیحات زیر را ببینید.) -- پیشوند PREFIX - فایل
پیشوند به فایل های خروجی اضافه خواهد شد. می تواند به کار رود
برای تعیین دایرکتوری های خروجی
--پسوند SUFFIX - پسوند فایل (اختیاری). می توان از آن برای تعیین فایل استفاده کرد
پسوند ها
--بول - سعی کنید بارکدها را در ابتدای دنباله ها مطابقت دهید.
(چیزی که زیست شناسان آن را انتهای 5 و برنامه نویسان شاخص 0 می نامند.)
--eol - سعی کنید بارکدها را در انتهای دنباله ها مطابقت دهید.
(چیزی که زیست شناسان آن را انتهای 3 و برنامه نویسان انتهای آن می نامند
رشته.) توجه: یکی از --بول, --eol باید مشخص شود، اما نه هر دو.
-- عدم تطابق ن - حداکثر تعداد عدم تطابق مجاز پیش فرض 1 است. --دقیقا - یکسان
به عنوان "--عدم تطابق 0". اگر هر دو --دقیقا و -- عدم تطابق
مشخص شده اند، «--exact» اولویت دارد.
--جزئي N - اجازه همپوشانی جزئی بارکدها را بدهید. (توضیحات زیر را ببینید.)
(پیشفرض مطابقت جزئی نیست)
--ساکت - شمارش و خلاصه را در پایان اجرا چاپ نکنید.
(پیشفرض چاپ است.)
- رفع اشکال - تعداد زیادی از اطلاعات اشکال زدایی بی فایده را در STDERR چاپ کنید. --کمک -
این صفحه کمک مفید است.
مثال (با فرض اینکه 's_2_100.txt' یک فایل FASTQ باشد، 'mybarcodes.txt' فایل بارکد است):
$ cat s_2_100.txt | /build/fastx-toolkit-V6DvdY/fastx-toolkit-0.0.14/debian/fastx-
toolkit/usr/bin/fastx_barcode_splitter.pl --bcfile mybarcodes.txt --bol
--عدم تطابق 2 \
-- پیشوند /tmp/bla_ --پسوند ".txt"
فرمت فایل بارکد ------------------- فایل های بارکد فایل های متنی ساده ای هستند. هر خط
باید شامل یک شناسه (نام توصیفی برای بارکد) و خود بارکد باشد
(A/C/G/T)، که با یک کاراکتر TAB از هم جدا شده است. مثال:
#این خط یک نظر است (با علامت 'عدد' شروع می شود) BC1 GATCT BC2 ATCGT BC3 GTGAT
BC4 TGTCT
برای هر بارکد، یک فایل FASTQ جدید (با شناسه بارکد به عنوان بخشی) ایجاد می شود.
از نام فایل). توالی های مطابق با بارکد در فایل مربوطه ذخیره می شوند.
اجرای مثال بالا (با فرض اینکه "mybarcodes.txt" حاوی بارکدهای بالا باشد)
فایل های زیر را ایجاد کنید:
/tmp/bla_BC1.txt /tmp/bla_BC2.txt /tmp/bla_BC3.txt /tmp/bla_BC4.txt
/tmp/bla_unmatched.txt
فایل "بی همتا" حاوی تمام دنباله هایی است که با هیچ بارکدی مطابقت ندارند.
تطبیق بارکد ----------------
** بدون تطابق جزئی:
عدم تطابق بین دنباله های FASTA/Q و بارکدها را بشمارید. بارکدی که
با کمترین تعداد عدم تطابق مطابقت دارد (به شرط اینکه تعداد کم یا مساوی باشد
'--عدم تطابق N') دنباله ها را 'می گیرد'.
مثال (با استفاده از بارکدهای بالا): ترتیب ورودی:
GATTTACTATGTAAAGATAGAAGGAATAAGGTGAAG
تطابق با '--بول -- عدم تطابق 1':
GATTTACTATGTAAAGATAGAAGGAATAAGGTGAAG GATCT (1 عدم تطابق، BC1) ATCGT (4 عدم تطابق،
BC2) GTGAT (3 عدم تطابق، BC3) TGTCT (3 عدم تطابق، BC4)
این دنباله به عنوان "BC1" طبقه بندی می شود (کمترین تعداد عدم تطابق را دارد). اگر
'--دقیق' یا '--عدم تطابق 0' مشخص شد، این دنباله به عنوان طبقه بندی می شود
"بی همتا" (زیرا، اگرچه BC1 کمترین تعداد عدم تطابق را داشت، اما بالاتر از حداکثر است
عدم تطابق مجاز).
تطبیق با '--eol' (انتهای خط) همین کار را انجام می دهد، اما از طرف دیگر
توالی.
** با تطابق جزئی (بسیار شبیه به ایندل):
مانند بالا، با افزودن زیر: بارکدها نیز برای همپوشانی جزئی بررسی می شوند
(تعداد پایه های مجاز غیر همپوشانی '--جزئی N' است).
مثال: دنباله ورودی ATTTACTATGTAAAGATAGAAGGAATAAGGTGAAG است (همانند بالا، اما توجه داشته باشید
«G» گم شده در ابتدا.)
تطابق (بدون جزئي با هم تداخل دارند) در برابر BC1 بازده 4 عدم تطابق:
ATTTACTATGTAAAGATAGAAGGAATAAGGTGAAG GATCT (4 عدم تطابق)
جزئي همپوشانی خواهد بود همچنین امتحان la پیروی همخوانی داشتن:
-atttactatgtaAagatagaAggaataAggtgaAg
GATCT (1 عدم تطابق)
توجه: امتیاز یک پایه از دست رفته را به عنوان عدم تطابق حساب می کند، بنابراین تعداد عدم تطابق نهایی 2 (1) است.
عدم تطابق "واقعی"، 1 عدم تطابق "پایه گمشده"). اگر در حال اجرا با '--ناهمخوانی 2' (به معنی
اجازه حداکثر 2 عدم تطابق) - این دنباله به عنوان BC1 طبقه بندی می شود.
با استفاده از خدمات onworks.net به صورت آنلاین از fastx_barcode_splitter.pl استفاده کنید
