انگلیسیفرانسویاسپانیایی

Ad


فاویکون OnWorks

bcftools - آنلاین در ابر

bcftools را در ارائه دهنده هاست رایگان OnWorks از طریق Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا کنید.

این دستور bcftools است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


samtools - ابزارهای کمکی برای فرمت ترتیب ترتیب/نقشه (SAM).

bcftools - ابزارهای کمکی برای فرمت تماس باینری (BCF) و VCF

خلاصه


samtools view -bt ref_list.txt -o aln.bam aln.sam.gz

samtools sort aln.bam aln.sorted

samtools index aln.sorted.bam

samtools idxstats aln.sorted.bam

samtools view aln.sorted.bam chr2:20,100,000-20,200,000

samtools merge out.bam in1.bam in2.bam in3.bam

samtools faidx ref.fasta

samtools pileup -vcf ref.fasta aln.sorted.bam

samtools mpileup -C50 -gf ref.fasta -r chr3:1,000-2,000 in1.bam in2.bam

samtools tview aln.sorted.bam ref.fasta

نمایه bcftools in.bcf

bcftools view in.bcf chr2:100-200 > out.vcf

bcftools view -Nvm0.99 in.bcf > out.vcf 2> out.afs

شرح


Samtools مجموعه ای از ابزارهای کاربردی است که ترازها را در قالب BAM دستکاری می کند. وارد می کند
از و صادرات به فرمت SAM (تراز توالی/نقشه)، مرتب سازی، ادغام و
نمایه سازی، و به شما امکان می دهد تا مطالب خوانده شده را در هر منطقه به سرعت بازیابی کنید.

Samtools برای کار بر روی یک جریان طراحی شده است. یک فایل ورودی «-» را به عنوان استاندارد در نظر می گیرد
ورودی (stdin) و یک فایل خروجی «-» به عنوان خروجی استاندارد (stdout). چندین دستور می تواند
بنابراین با لوله های یونیکس ترکیب شود. Samtools همیشه پیام های اخطار و خطا را به خروجی می دهد
خروجی خطای استاندارد (stderr).

Samtools همچنین می‌تواند یک فایل BAM (نه SAM) را روی سرور FTP یا HTTP راه دور باز کند،
نام فایل BAM با «ftp://» یا «http://» شروع می شود. Samtools کار فعلی را بررسی می کند
دایرکتوری برای فایل ایندکس و در صورت عدم حضور، فهرست را دانلود می کند. Samtools ندارد
کل فایل تراز را بازیابی کنید مگر اینکه از آن خواسته شود.

SAMTOOLS دستورات و OPTIONS


دیدن مشاهده samtools [-bchuHS] [-t in.refList] [-o خروجی] [-f reqFlag] [-F skipFlag]
[-q minMapQ] [-l کتابخانه] [-r readGroup] [-R rgFile] | [منطقه 1
[...]]

استخراج/چاپ همه ترازها یا ترازهای فرعی در قالب SAM یا BAM. اگر هیچ منطقه ای نیست
مشخص شده، تمام ترازها چاپ خواهند شد. در غیر این صورت فقط ترازها
همپوشانی مناطق مشخص شده خروجی خواهد شد. ممکن است یک تراز داده شود
اگر چندین ناحیه با هم تداخل داشته باشد چندین بار. یک منطقه می تواند ارائه شود،
برای مثال، در قالب زیر: «chr2» (کل chr2)، «chr2:1000000»
(منطقه از 1,000,000bp) یا 'chr2:1,000,000-2,000,000' (منطقه بین
1,000,000 و 2,000,000bp با احتساب نقاط پایانی). مختصات بر اساس 1 است.

گزینه ها:

-b خروجی در فرمت BAM.

-f INT فقط ترازهای خروجی با تمام بیت های موجود در INT موجود در فیلد FLAG.
INT می تواند به صورت هگز در قالب /^0x[0-9A-F]+/ [0] باشد.

-F INT رد شدن از ترازبندی با بیت های موجود در INT [0]

-h هدر را در خروجی قرار دهید.

-H خروجی فقط هدر.

-l STR فقط خروجی خواندن در کتابخانه STR [null]

-o فایل فایل خروجی [stdout]

-q INT رد شدن از ترازها با MAPQ کوچکتر از INT [0]

-r STR خروجی فقط در گروه خواندن STR [null] خوانده می شود

-R فایل خروجی در گروه های خواندنی فهرست شده در می خواند فایل [خالی]

-s شناور کسری از الگوها/جفت ها به نمونه فرعی. قسمت عدد صحیح درمان می شود
به عنوان دانه برای مولد اعداد تصادفی [-1]

-S ورودی در SAM است. اگر خطوط سرصفحه @SQ وجود نداشته باشد، "-t" گزینه است
مورد نیاز است.

-c به جای چاپ ترازها، فقط آنها را بشمارید و چاپ کنید
تعداد کل. تمام گزینه های فیلتر، مانند "-f", "-F" و "-q" ، هستند
در نظر گرفته شده است.

-t فایل این فایل با TAB محدود شده است. هر خط باید حاوی نام مرجع باشد
و طول مرجع، یک خط برای هر مرجع مجزا.
فیلدهای اضافی نادیده گرفته می شوند. این فایل همچنین ترتیب کار را مشخص می کند
توالی های مرجع در مرتب سازی اگر «samtools faidx» را اجرا کنید '،
فایل فهرست حاصل فای می تواند به این صورت استفاده شود
فایل.

-u خروجی BAM غیر فشرده. این گزینه در زمان صرف شده صرفه جویی می کند
فشرده سازی/فشرده سازی و بنابراین زمانی که خروجی باشد ترجیح داده می شود
به دستور دیگری از samtools منتقل می شود.

مشاهده samtools tview [-p chr:pos] [-s STR] [-d نمایش] [ref.fasta]

نمایشگر ترازبندی متن (بر اساس کتابخانه ncurses). در بیننده، "؟" را فشار دهید
برای کمک، "g" را فشار دهید تا شروع تراز از یک منطقه در قالب را بررسی کنید
مانند 'chr10:10,000,000' یا '=10,000,000' هنگام مشاهده همان مرجع
توالی.

گزینه های ارسال:

-d نمایش خروجی به صورت (H)tml یا (C)urses یا (T)ext

-p chr:pos مستقیماً به این موقعیت بروید

-s STR نمایش فقط خوانده شده از این نمونه یا گروه خوانده شده

mpileup samtools mpileup [-EBugp] [-C capQcoef] [-r REG] [-f in.fa] [-l فهرست] [-M
capMapQ] [-Q minBaseQ] [-q minMapQ] in.bam [in2.bam [...]]

BCF یا pileup را برای یک یا چند فایل BAM ایجاد کنید. سوابق تراز هستند
گروه بندی شده توسط شناسه های نمونه در خطوط سرصفحه @RG. اگر شناسه های نمونه هستند
در صورت عدم وجود، هر فایل ورودی به عنوان یک نمونه در نظر گرفته می شود.

در قالب pileup (بدون -uor-gهر خط نشان دهنده یک موقعیت ژنومی است،
متشکل از نام کروموزوم، مختصات، پایه مرجع، پایه های خواندن، خواندن
کیفیت ها و کیفیت های نقشه برداری تراز. اطلاعات مربوط به تطابق، عدم تطابق،
indel، strand، کیفیت نقشه برداری و شروع و پایان خواندن همگی در کد گذاری می شوند
ستون پایه خواندن در این ستون، یک نقطه نشان دهنده مطابقت با مرجع است
پایه روی رشته جلو، یک کاما برای مسابقه در رشته معکوس، یک '>' یا
"<" برای پرش مرجع، "ACGTN" برای عدم تطابق در رشته جلو و
«acgtn» برای عدم تطابق در رشته معکوس. الگوی «\+[0-9]+[ACGTNacgtn]+»
نشان می دهد که بین این موقعیت مرجع و موقعیت بعدی درج وجود دارد
موقعیت مرجع طول درج با عدد صحیح در داده می شود
الگو، به دنبال دنباله درج شده. به طور مشابه، یک الگو
«-[0-9]+[ACGTNacgtn]+» یک حذف از مرجع را نشان می‌دهد. حذف شده
پایه ها به صورت '*' در خطوط زیر ارائه می شوند. همچنین در پایگاه خواندن
ستون، نماد «^» شروع خواندن را نشان می دهد. ASCII شخصیت
زیر «^» منهای 33 کیفیت نگاشت را نشان می دهد. نماد «$» پایان آن را نشان می‌دهد
یک بخش خواندنی

ورودی گزینه های ارسال:

-6 فرض کنید کیفیت در کدگذاری Illumina 1.3+ است. -A رد نشوید
جفت خواندن غیرعادی در فراخوانی متغیر.

-B تنظیم مجدد احتمالی را برای محاسبه پایه غیرفعال کنید
کیفیت تراز (BAQ). BAQ احتمال خواندن با مقیاس Phred است
پایه نامناسب است استفاده از این گزینه کمک زیادی به کاهش می کند
SNP های کاذب ناشی از ناهماهنگی ها

-b فایل فهرست فایل های BAM ورودی، یک فایل در هر خط [null]

-C INT ضریب کاهش کیفیت نقشه برداری برای خواندن حاوی
عدم تطابق بیش از حد با توجه به قرائت با احتمال phred-scale q
از موقعیت نقشه برداری شده، کیفیت نقشه برداری جدید ایجاد می شود
در مورد sqrt((INT-q)/INT)*INT است. مقدار صفر این را غیرفعال می کند
عملکرد؛ اگر فعال باشد، مقدار توصیه شده برای BWA 50 است. [0]

-d INT در یک موقعیت، حداکثر بخوانید INT خواندن در هر ورودی BAM. [250]

-E محاسبات BAQ گسترده این گزینه به حساسیت به ویژه برای
MNP ها، اما ممکن است کمی به ویژگی آسیب برساند.

-f فایل La faidxفایل مرجع نمایه شده در قالب FASTA. فایل می تواند باشد
به صورت اختیاری فشرده شده توسط رازیپ. [خالی]

-l فایل BED یا فایل لیست موقعیت حاوی لیستی از مناطق یا سایت هایی که در آن ها وجود دارد
pileup یا BCF باید تولید شود [null]

-q INT حداقل کیفیت نقشه برداری برای تراز مورد استفاده [0]

-Q INT حداقل کیفیت پایه برای یک پایه که باید در نظر گرفته شود [13]

-r STR فقط در منطقه انباشته ایجاد کنید STR [همه سایت ها]

تولید گزینه های ارسال:

-D عمق خواندن خروجی در هر نمونه

-g احتمالات ژنوتیپ را محاسبه کنید و آنها را در فرمت فراخوانی باینری خروجی بگیرید
(BCF).

-S خروجی در هر نمونه P-value بایاس رشته با مقیاس Phred

-u مشابه -g با این تفاوت که خروجی BCF فشرده نشده است که اینطور است
برای لوله کشی ترجیح داده می شود.

گزینه برای ژنوتیپ احتمال محاسبات (برای -g or -u):

-e INT احتمال خطای توالی یابی گسترش شکاف با مقیاس Phred. کاهش می دهد INT
منجر به ایندل طولانی تر می شود. [20]

-h INT ضریب مدل سازی خطاهای هموپلیمر. با توجه به یک lطولانی
اجرای هموپلیمر، خطای توالی یک ایندل اندازه s مدل سازی شده است
as INT*s/l. [100]

-I تماس INDEL را انجام ندهید

-L INT اگر میانگین عمق هر نمونه بالاتر است از تماس INDEL صرفنظر کنید INT.
[250]

-o INT احتمال خطای توالی باز شکاف با مقیاس Phred. کاهش می دهد INT منجر
به تماس های بیشتر ایندل. [40]

-p برای افزایش حساسیت، آستانه های -m و -F را در هر نمونه اعمال کنید
صدا زدن. به طور پیش‌فرض هر دو گزینه برای خواندن‌های جمع‌شده از همه اعمال می‌شوند
نمونه ها.

-P STR لیست پلتفرم‌ها با کاما محدود شده (تعیین شده توسط @RG-PL) از کدام
نامزدهای ایندل به دست می آیند. توصیه می شود ایندل را جمع آوری کنید
نامزدهای فناوری‌های توالی‌یابی که نرخ خطای ایندل پایینی دارند
مانند ILLUMINA. [همه]

سر سر سرسره سامتولز

هدر را جایگزین کنید in.bam با هدر داخل in.header.sam. این دستور است
بسیار سریعتر از جایگزینی هدر با تبدیل BAM->SAM->BAM.

گربه samtools cat [-h header.sam] [-o out.bam] [...]

BAM ها را به هم متصل کنید. فرهنگ لغت ترتیب هر BAM ورودی باید یکسان باشد،
اگرچه این دستور این را بررسی نمی کند. این دستور از ترفند مشابهی استفاده می کند
سر سر که اتصال سریع BAM را امکان پذیر می کند.

نوع samtools مرتب سازی [-nof] [-m maxMem]

ترازها را بر اساس مختصات سمت چپ مرتب کنید. فایل بام ایجاد خواهد شد.
این دستور ممکن است فایل های موقت نیز ایجاد کند .%d.bam زمانی که کل
تراز را نمی توان در حافظه قرار داد (با گزینه -m کنترل می شود).

گزینه ها:

-o خروجی تراز نهایی به خروجی استاندارد.

-n مرتب سازی بر اساس نام خوانده شده به جای مختصات کروموزومی

-f استفاده کنید به عنوان مسیر خروجی کامل و اضافه نمی شود بام پسوند.

-m INT تقریباً حداکثر حافظه مورد نیاز. [500000000]

ادغام کردن samtools ادغام [-nur1f] [-h inh.sam] [-R reg]
[...]

چند تراز مرتب شده را ادغام کنید. هدر مرجع همه ورودی ها را فهرست می کند
فایل‌های BAM و هدرهای SQ@ inh.sam، در صورت وجود، همه باید به یکسان مراجعه کنند
مجموعه ای از توالی های مرجع فهرست مرجع سرصفحه و (مگر اینکه توسط
-h) "@" سرصفحه های in1.bam کپی خواهد شد بیرون.بام، و سرصفحه های دیگر
فایل ها نادیده گرفته خواهند شد

گزینه ها:

-1 از سطح فشرده سازی zlib 1 برای فشرده سازی خروجی استفاده کنید

-f در صورت وجود فایل خروجی را مجبور به بازنویسی کنید.

-h فایل از خطوط استفاده کنید فایل به عنوان هدرهای «@» که باید در آنها کپی شود بیرون.بام، جایگزین
هر خط سرصفحه ای که در غیر این صورت از آن کپی می شود in1.bamاست. (فایل is
در واقع در قالب SAM، هر چند هر رکورد تراز ممکن است حاوی باشد
نادیده گرفته می شود.)

-n ترازهای ورودی بر اساس نام های خوانده شده به جای کروموزومی مرتب می شوند
مختصات

-R STR ادغام فایل ها در منطقه مشخص شده توسط STR [خالی]

-r به هر تراز یک تگ RG بچسبانید. مقدار تگ از فایل استنتاج می شود
نامها

-u خروجی BAM غیر فشرده

شاخص شاخص samtools

تراز مرتب شده فهرست برای دسترسی تصادفی سریع. فایل فهرست بای خواهد بود
ایجاد شده است.

idxstats samtools idxstats

بازیابی و چاپ آمار در فایل فهرست. خروجی با TAB مشخص شده است
هر خط متشکل از نام دنباله مرجع، طول دنباله، # خواندن نقشه‌برداری شده است
و # خواندن نقشه برداری نشده.

faidx samtools faidx [منطقه 1 [...]]

دنباله مرجع ایندکس در قالب FASTA یا استخراج دنباله فرعی از نمایه شده
دنباله مرجع اگر هیچ منطقه ای مشخص نشده باشد، faidx فایل را ایندکس می کند و
ایجاد فای روی دیسک اگر مناطق مشخص شده اند، دنباله ها
در قالب FASTA در stdout بازیابی و چاپ خواهد شد. فایل ورودی می تواند
فشرده شود در RAZF فرمت.

ثابت کردن samtools fixmate

مختصات همسر، ISIZE و پرچم های مربوط به همسر را از یک نام مرتب شده پر کنید
هم ترازی.

rmdup samtools rmdup [-sS]

موارد تکراری احتمالی PCR را حذف کنید: اگر چندین جفت خوانده خارجی یکسان داشته باشند
مختصات، فقط جفت با بالاترین کیفیت نقشه برداری را حفظ کنید. در جفت -
حالت پایان، این دستور تنها با جهت گیری FR کار می کند و نیاز به ISIZE دارد
به درستی تنظیم کنید برای خواندن های جفت نشده کار نمی کند (مثلاً دو انتهای که به آن نگاشت شده اند
کروموزوم های مختلف یا یتیم خوانده می شود).

گزینه ها:

-s حذف تکراری برای خواندن های تک پایانی. به طور پیش فرض، دستور برای کار می کند
فقط خواندنی های جفتی

-S خواندن های زوجی و خواندن های تک پایانی را درمان کنید.

آرام شد samtools آرام شد [-EeubSr] [-C capQcoef]

تگ MD را ایجاد کنید. اگر تگ MD از قبل وجود داشته باشد، این دستور a را می دهد
هشدار در صورتی که تگ MD تولید شده با تگ موجود متفاوت باشد. خروجی SAM
به صورت پیش فرض.

گزینه ها:

-A هنگام استفاده مشترک با -r این گزینه پایه اصلی را بازنویسی می کند
کیفیت.

-e اگر یک پایه خوانده شده با مرجع تراز شده یکسان است، به = تبدیل کنید
پایه. تماس گیرنده Indel در حال حاضر از پایه های = پشتیبانی نمی کند.

-u خروجی BAM غیر فشرده

-b خروجی BAM فشرده

-S ورودی SAM با خطوط سرصفحه است

-C INT ضریب تا سقف کیفیت نگاشت قرائت های با نقشه ضعیف. را ببینید
انباشته شدن دستور برای جزئیات [0]

-r تگ BQ (بدون -A) یا کیفیت پایه درپوش را با BAQ (با -A) محاسبه کنید.

-E محاسبه BAQ توسعه یافته. این گزینه ویژگی را برای
حساسیت، اگرچه اثر جزئی است.

هدف کات samtools targetcut [-Q minBaseQ] [-i inPenalty] [-0 em0] [-1 em1] [-2 em2] [-f
مرجع]

این دستور با بررسی تداوم خواندن، مناطق هدف را شناسایی می کند
عمق، توالی اجماع هاپلوئید اهداف را محاسبه می کند و یک SAM را با
هر دنباله مربوط به یک هدف. گزینه When -f در حال استفاده است، BAQ خواهد بود
کاربردی. این دستور است فقط طراحی شده برای برش کلون های فسمید از fosmid
توالی استخر [Ref. کیتزمن و همکاران (2010)].

فاز فاز samtools [-AF] [-k len] [-b پیشوند] [-q minLOD] [-Q minBaseQ]

فراخوانی و فاز SNP هتروزیگوت. گزینه ها:

-A رها خواندن با فاز مبهم.

-b STR پیشوند خروجی BAM. هنگامی که این گزینه در حال استفاده است، خواندن فاز 0 خواهد بود
در فایل ذخیره شده است STR.0.بام و فاز-1 خوانده می شود STR.1.بام. فاز ناشناخته
خواندن به طور تصادفی به یکی از دو فایل اختصاص داده می شود. کایمریک می خواند
با خطاهای سوئیچ ذخیره خواهد شد STR.کیمریک.بام. [خالی]

-F سعی نکنید قرائت های کایمریک را اصلاح کنید.

-k INT حداکثر طول برای فازبندی محلی. [13]

-q INT حداقل LOD با مقیاس Phred برای فراخوانی هتروزیگوت. [40]

-Q INT حداقل کیفیت پایه برای استفاده در تماس تلفنی. [13]

BCFTOOLS دستورات و OPTIONS


دیدن bcftools دیدن [-AbFGNQSucgv] [-D seqDict] [-l listLoci] [-s listSample] [-i
gapSNPratio] [-t mutRate] [-p varThres] [-m varThres] [-P قبلی] [-1 nGroup1]
[-d minFrac] [-U nPerm] [-X permThres] [-T سه تایپ] in.bcf [منطقه]

بین BCF و VCF تبدیل کنید، نامزدهای مختلف را فراخوانی کنید و آلل را تخمین بزنید
فرکانس ها

ورودی خروجی گزینه های ارسال:

-A تمام آلل های جایگزین ممکن را در مکان های مختلف حفظ کنید. به صورت پیش فرض،
دستور view آلل های بعید را کنار می گذارد.

-b خروجی در فرمت BCF. پیش فرض VCF است.

-D فایل فرهنگ لغت توالی (فهرست نام های کروموزوم) برای تبدیل VCF->BCF
[خالی]

-F نشان دهید PL توسط r921 یا قبل از آن تولید شده است (سفارش متفاوت است).

-G تمام اطلاعات ژنوتیپ فردی را سرکوب کنید.

-l فایل لیست سایت هایی که اطلاعات در آنها خروجی می شود [همه سایت ها]

-N از سایت‌هایی که فیلد REF A/C/G/T نیست بگذرید

-Q فرمت احتمال QCALL را خروجی بگیرید

-s فایل لیست نمونه های مورد استفاده ستون اول در ورودی نمونه را می دهد
نام ها و دومی پلوئیدی را می دهد که فقط می تواند 1 یا 2 باشد. When
ستون 2 وجود ندارد، پلوئیدی نمونه 2 در نظر گرفته می شود
در خروجی، ترتیب نمونه ها مشابه نمونه های موجود خواهد بود فایل.
[خالی]

-S ورودی به جای BCF VCF است.

-u خروجی BCF فشرده نشده (نیروی -b).

اجماع / متغیر صدا زدن گزینه های ارسال:

-c فراخوانی انواع با استفاده از استنتاج بیزی. این گزینه به صورت خودکار
گزینه را فرا می خواند -e.

-d شناور چه زمانی -v در حال استفاده است، مکان هایی را رد کنید که در آن کسری از نمونه ها تحت پوشش قرار می گیرند
خوانده شده در زیر FLOAT است. [0]

-e فقط استنتاج حداکثر احتمال، از جمله تخمین سایت را انجام دهید
فرکانس آللی، تست تعادل هاردی واینبرگ و آزمایش
ارتباط با LRT

-g فراخوانی ژنوتیپ‌های هر نمونه در مکان‌های مختلف (force -c)

-i شناور نسبت نرخ جهش INDEL به SNP [0.15]

-m شناور مدل جدید برای بهبود تماس چند آللی و کمیاب. یکی دیگر
اگر P(chi^2) LRT از آستانه FLOAT فراتر رود، آلل ALT پذیرفته می شود.
پارامتر قوی به نظر می رسد و مقدار واقعی معمولاً اینطور نیست
نتایج را بسیار تحت تأثیر قرار می دهد. یک مقدار خوب برای استفاده 0.99 است. این است
روش فراخوانی توصیه شده [0]

-p شناور یک سایت به عنوان یک نوع در نظر گرفته می شود اگر P(ref|D)

-P STR طیف فرکانس آللی قبلی یا اولیه. اگر STR می تواند باشد کامل, شرط 2,
صاف یا فایلی که از خروجی خطا از یک نوع قبلی تشکیل شده است
فراخوانی اجرا

-t شناور نرخ جهش مقیاس شده برای فراخوانی نوع [0.001]

-T STR تماس زوج/سه‌گانه را فعال کنید. برای تماس سه نفره، گزینه -s معمولا
باید برای پیکربندی اعضای سه گانه و ترتیب آنها اعمال شود.
در فایل ارائه شده به گزینه -s، اولین نمونه باید باشد
فرزند، دومی پدر و سومی مادر. معتبر
ارزش های STR عبارتند از "pair"، "trioauto"، "trioxd" و "trioxs".
"جفت" تفاوت بین دو نمونه ورودی و "trioxd" را فراخوانی می کند.
('trioxs') مشخص می کند که ورودی از کروموزوم X غیر PAR است
مناطق و کودک زن (مرد) است. [خالی]

-v فقط سایت های نوع خروجی (force -c)

کنتراست صدا زدن و انجمن تست گزینه های ارسال:

-1 INT تعداد نمونه های گروه 1. این گزینه برای تقسیم استفاده می شود
نمونه ها را به دو گروه برای فراخوانی SNP کنتراست یا تست ارتباط تقسیم کردند.
هنگامی که این گزینه در حال استفاده است، VCF INFO زیر خروجی خواهد شد:
PC2، PCHI2 و QCHI2. [0]

-U INT تعداد جایگشت‌ها برای تست ارتباط (فقط با -1)
[0]

-X شناور فقط جایگشت برای P(chi^2) انجام دهید -U)
[0.01]

شاخص bcftools شاخص in.bcf

ایندکس BCF را برای دسترسی تصادفی مرتب کرد.

گربه bcftools گربه in1.bcf [in2.bcf [...]]]

فایل های BCF را به هم متصل کنید. فایل های ورودی باید مرتب شده و دارای آن باشند
نمونه های یکسان به همان ترتیب ظاهر می شوند.

SAM FORMAT


قالب توالی تراز/نقشه (SAM) با TAB محدود شده است. به غیر از خطوط سرصفحه، که
با نماد «@» شروع می شود، هر خط تراز شامل موارد زیر است:

┌────┬───────┬──────────────────────────────────── ─────────────────────
سرهنگمیدانتوضیحات:
├────┼───────┼──────────────────────────────────── ─────────────────────
│ 1 │ QNAME │ پرس و جو الگو/جفت NAME │
│ 2 │ FLAG │ بیتی FLAG │
│ 3 │ RNAME │ دنباله مرجع NAME │
│ 4 │ POS │ 1-پایه سمت چپ ترین موقعیت / مختصات دنباله بریده شده │
│ 5 │ MAPQ │ کیفیت MAPping (مقیاس عددی) │
│ 6 │ CIAGR │ رشته سیگار طولانی │
│ 7 │ MRNM │ Mate Reference Sequence NaMe (`=' اگر همان RNAME باشد) │
│ 8 │ MPOS │ موقعیت Mate مبتنی بر 1 │
│ 9 │ TLEN │ طول الگوی استنباط شده (اندازه درج) │
│10 │ SEQ │ پرس و جو SEQuence در همان رشته مرجع │
│11 │ QUAL │ Query QUALity (ASCII-33 کیفیت پایه Phred را می دهد) │
│12+ │ OPT │ متغیر فیلدهای اختیاری در قالب TAG:VTYPE:VALUE │
└────┴───────┴──────────────────────────────────── ─────────────────────

هر بیت در فیلد FLAG به صورت زیر تعریف می شود:

┌───────┬─────┬─────────────────────────────────── ───────────────┐
پرچمپیش از میلادتوضیحات:
├───────┼─────┼─────────────────────────────────── ───────────────┤
│0x0001 │ p │ خوانده شده به ترتیب جفت می شود │
│0x0002 │ P │ خوانده شده در یک جفت مناسب نگاشت شده است │
│0x0004 │ u │ خود توالی پرس و جو نگاشت نشده است │
│0x0008 │ U │ جفت بدون نقشه │
│0x0010 │ r │ رشته پرس و جو (1 برای معکوس) │
│0x0020 │ R │ رشته جفت │
│0x0040 │ 1 │ خوانده شده اولین خوانده شده در یک جفت است │
│0x0080 │ 2 │ خوانده شده دومین خوانده شده در یک جفت است │
│0x0100 │ s │ تراز اولیه نیست │
│0x0200 │ f │ خطای خواندن پلت فرم/بررسی کیفیت فروشنده │
│0x0400 │ d │ خوانده شده یا PCR یا تکراری نوری است │
└───────┴─────┴─────────────────────────────────── ───────────────┘
که در آن ستون دوم نمایش رشته ای از فیلد FLAG را نشان می دهد.

VCF FORMAT


فرمت فراخوانی متغیر (VCF) یک فرمت محدود شده با TAB است که هر خط داده شامل
فیلدهای زیر

┌────┬────────┬─────────────────────────────────── ──────────────────
سرهنگمیدانتوضیحات:
├────┼────────┼─────────────────────────────────── ──────────────────
│ 1 │ CHROM │ نام کروموزوم │
│ 2 │ POS │ سمت چپ ترین موقعیت از نوع │
│ 3 │ شناسه │ شناسه نوع منحصر به فرد │
│ 4 │ REF │ آلل مرجع │
│ 5 │ ALT │ آلل(های) ALTernate، که با کاما از هم جدا شده اند │
│ 6 │ QUAL │ نوع / مرجع کیفیت │
│ 7 │ FILTER │ فیلترها اعمال شده │
│ 8 │ INFO │ اطلاعات مربوط به نوع، جدا شده با نیم دونقطه │
│ 9 │ FORMAT │ FORMAT میدان های ژنوتیپ، جدا شده با کولون (اختیاری) │
│10+ │ SAMPLE │ SAMPLE ژنوتیپ ها و اطلاعات هر نمونه (اختیاری) │
└────┴────────┴─────────────────────────────────── ───────────────────

جدول زیر نشان می دهد اطلاعات برچسب های استفاده شده توسط samtools و bcftools.

┌──────┬───────────┬────────────────────────────── ────────────────────────────────────────────────── ────────────────────┐
برچسبقالبتوضیحات:
├──────┼───────────┼────────────────────────────── ────────────────────────────────────────────────── ────────────────────┤
└──────┴───────────┴────────────────────────────── ────────────────────────────────────────────────── ────────────────────┘

مثال ها


o زمانی که SAM را به BAM وارد کنید @SQ خطوط در هدر وجود دارد:

samtools view -bS aln.sam > aln.bam

If @SQ خطوط وجود ندارد:

samtools faidx ref.fa
samtools view -bt ref.fa.fai aln.sam > aln.bam

جایی که رفر.فا.فای به طور خودکار توسط faidx فرمان

o را وصل کنید RG هنگام ادغام ترازهای مرتب شده برچسب بزنید:

پرل-ای چاپ
"@RG\tID:ga\tSM:hs\tLB:ga\tPL:Illumina\n@RG\tID:454\tSM:hs\tLB:454\tPL:454\n"' > rg.txt
samtools merge -rh rg.txt merged.bam ga.bam 454.bam

مقدار در a RG برچسب با نام فایلی که خوانده می شود تعیین می شود. در این
به عنوان مثال، در ادغام شد.بام، می خواند از ga.bam ضمیمه خواهد شد RG:Z:ga، در حالی که از
454.bam ضمیمه خواهد شد RG:Z:454.

o SNP ها و INDEL های کوتاه را برای یک فرد دیپلوئید فراخوانی کنید:

samtools mpileup -ugf ref.fa aln.bam | bcftools view -bvcg - > var.raw.bcf
bcftools view var.raw.bcf | vcfutils.pl varFilter -D 100 > var.flt.vcf

La -D گزینه varFilter حداکثر عمق خواندن را کنترل می کند که باید تنظیم شود
حدود دو برابر عمق متوسط ​​خواندن ممکن است یکی اضافه کند -C50 به mpileup اگر نقشه برداری
برای خواندن هایی که دارای عدم تطابق بیش از حد هستند، کیفیت بیش از حد برآورد شده است. اعمال این گزینه
معمولا کمک می کند BWA-کوتاه اما ممکن است نقشه‌برداران دیگر نباشند.

o توالی اجماع را برای یک فرد دیپلوئید ایجاد کنید:

samtools mpileup -uf ref.fa aln.bam | bcftools view -cg - | vcfutils.pl vcf2fq >
cns.fq

o جهش های جسمی را از یک جفت نمونه فراخوانی کنید:

samtools mpileup -DSuf ref.fa aln.bam | bcftools view -bvcgT pair - > var.bcf

در قسمت اطلاعات خروجی، CLR نسبت Phred-log بین احتمال توسط را نشان می دهد
درمان دو نمونه به طور مستقل، و احتمال با نیاز به ژنوتیپ به
یکسان باشد این CLR به طور موثر نمره ای برای اندازه گیری اعتماد به نفس جسمانی است
تماس می گیرد. هر چه بالاتر بهتر.

o Call de novo و جهش های جسمی از سه خانواده:

samtools mpileup -DSuf ref.fa aln.bam | bcftools view -bvcgT pair -s samples.txt - >
var.bcf

پرونده samples.txt باید از سه خط تشکیل شده باشد که عضو و ترتیب آن را مشخص می کند
نمونه ها (به ترتیب فرزند-پدر-مادر). به همین ترتیب، CLR Phred-log را می دهد
نسبت احتمال با و بدون محدودیت سه گانه. CGU محتمل ترین را نشان می دهد
پیکربندی ژنوتیپ بدون محدودیت سه گانه، و CGT محتمل ترین را می دهد
پیکربندی ژنوتیپ که محدودیت سه گانه را برآورده می کند.

o فاز یک فردی:

samtools aramd -AEur aln.bam ref.fa | samtools فاز -ب پیشوند - >phase.out

La آرام شد دستور برای کاهش هتروزیگوت های کاذب در اطراف INDEL ها استفاده می شود.

o فراخوانی SNP و Indel های کوتاه برای افراد دیپلوئید متعدد:

samtools mpileup -P ILLUMINA -ugf ref.fa *.bam | bcftools view -bcvg - > var.raw.bcf
bcftools view var.raw.bcf | vcfutils.pl varFilter -D 2000 > var.flt.vcf

افراد از شناسایی می شوند SM برچسب ها در @RG خطوط سرصفحه افراد می توانند باشند
جمع شده در یک فایل تراز. یک فرد همچنین می تواند به چندین فایل جدا شود.
La -P گزینه مشخص می کند که نامزدهای indel باید فقط از گروه های خوانده شده جمع آوری شوند
با @RG-PL برچسب تنظیم شده است ایلومینا. جمع آوری نامزدهای ایندل از توالی خواندن
توسط یک فناوری مستعد ایندل ممکن است بر عملکرد تماس ایندل تأثیر بگذارد.

توجه داشته باشید که یک مدل فراخوانی جدید وجود دارد که می تواند توسط آن فراخوانی شود

bcftools view -m0.99 ...

که برخی از محدودیت های شدید روش پیش فرض را رفع می کند.

برای فیلتر کردن، به نظر می رسد بهترین نتایج با استفاده از ابتدا به دست می آید SnpGap فیلتر و
سپس برخی از رویکردهای یادگیری ماشین را به کار می برند

vcf-annotate -f SnpGap=n
فیلتر vcf ...

هر دو را می توان در vcftools و htslib بسته (لینک های زیر).

طیف فرکانس آللی (AFS) را در فهرستی از سایت‌ها از چندین فرد استخراج کنید:

samtools mpileup -Igf ref.fa *.bam > all.bcf
bcftools view -bl sites.list all.bcf > sites.bcf
bcftools view -cGP cond2 sites.bcf > /dev/null 2> sites.1.afs
bcftools view -cGP sites.1.afs sites.bcf > /dev/null 2> sites.2.afs
bcftools view -cGP sites.2.afs sites.bcf > /dev/null 2> sites.3.afs
......

جایی که sites.list شامل فهرستی از سایت ها با هر خط از مرجع است
نام و موقعیت دنباله به شرح زیر bcftools دستورات AFS را توسط EM تخمین می زنند.

o تراز BAQ را برای سایر تماس گیرندگان SNP اعمال کنید:

samtools aramed -bAr aln.bam > aln.baq.bam

اضافه می کند و تصحیح می کند NM و MD برچسب ها به طور همزمان در آرام شد فرمان نیز می آید
با -C گزینه، همان گزینه در انباشته شدن و mpileup. اگر کمک کرد درخواست کنید

محدودیت ها


o کلمات بدون تراز مورد استفاده در bam_import.c، bam_endian.h، bam.c و bam_aux.c.

o Samtools paired rmdup برای خواندن های جفت نشده کار نمی کند (مثلاً خواندن یا پایان های یتیم)
نگاشت به کروموزوم های مختلف). اگر نگران کننده است، لطفا از Picard استفاده کنید
MarkDuplicate که به درستی این موارد را کنترل می کند، هرچند کمی کندتر.

با استفاده از خدمات onworks.net از bcftools به صورت آنلاین استفاده کنید


سرورها و ایستگاه های کاری رایگان

دانلود برنامه های ویندوز و لینوکس

  • 1
    فایر فاکس
    فایر فاکس
    Firebird RDBMS ویژگی های ANSI SQL را ارائه می دهد
    و روی لینوکس، ویندوز و اجرا می شود
    چندین پلتفرم یونیکس امکانات
    همزمانی و عملکرد عالی
    & قدرت...
    Firebird را دانلود کنید
  • 2
    KompoZer
    KompoZer
    KompoZer یک ویرایشگر HTML wysiwyg است که از آن استفاده می کند
    پایگاه کد موزیلا کامپوزر مانند
    توسعه Nvu متوقف شده است
    در سال 2005، KompoZer بسیاری از باگ ها را برطرف کرد و
    اف می افزاید...
    دانلود KompoZer
  • 3
    دانلود مانگا رایگان
    دانلود مانگا رایگان
    دانلودر رایگان مانگا (FMD) یک برنامه است
    برنامه متن باز نوشته شده در
    Object-Pascal برای مدیریت و
    دانلود مانگا از وب سایت های مختلف
    این یک آینه است...
    دانلود رایگان مانگا دانلود
  • 4
    اتبوتین
    اتبوتین
    UNetbootin به شما این امکان را می دهد که بوتیبل ایجاد کنید
    درایوهای USB زنده برای اوبونتو، فدورا و
    سایر توزیع های لینوکس بدون
    رایت سی دی روی ویندوز، لینوکس و
    و ...
    UNetbootin را دانلود کنید
  • 5
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM یک ابزار آسان برای استفاده است
    بسته نرم افزاری منبع باز ERP و CRM
    (با یک سرور وب php یا به عنوان اجرا شود
    نرم افزار مستقل) برای مشاغل،
    پایه های ...
    دانلود Dolibarr ERP - CRM
  • 6
    SQuirreL SQL مشتری
    SQuirreL SQL مشتری
    SQuirreL SQL Client یک SQL گرافیکی است
    مشتری نوشته شده در جاوا که اجازه می دهد
    برای مشاهده ساختار یک JDBC
    پایگاه داده سازگار، داده ها را در آن مرور کنید
    جداول...
    دانلود SQuirreL SQL Client
  • بیشتر "

دستورات لینوکس

Ad