pbsim - آنلاین در ابر

این دستور pbsim است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


pbsim - شبیه ساز برای خواندن توالی PacBio

خلاصه


pbsim گزینه های

شرح


La pbsim فرمان خواندن های شبیه سازی شده PacBio را برای توالی مرجع FASTA تولید می کند
.

فایل های مدل (پارامترهای --model-qc گزینه) را می توان در
پوشه /usr/share/pbsim/models.

OPTIONS


گزینه های pbsim را می توان به کلی، مبتنی بر نمونه و مبتنی بر مدل تقسیم کرد
گزینه های شبیه سازی

سوالات عمومی گزینه های
-- پیشوند
پیشوند فایل های خروجی (sd).

--نوع داده
نوع داده. CLR یا CCS (CLR).

--عمق
عمق پوشش (CLR: 20.0، CCS: 50.0).

--طول-دقیقه
حداقل طول (100).

-- طول - حداکثر
حداکثر طول (CLR: 25000، CCS: 2500).

-- دقت - دقیقه
حداقل دقت (CLR: 0.75، CCS: ثابت به عنوان 0.75). این گزینه فقط در
مورد CLR

-- دقت - حداکثر
حداکثر دقت (CLR: 1.00، CCS: ثابت به عنوان 1.00). این گزینه فقط در
مورد CLR

- نسبت تفاوت
نسبت تفاوت ها جایگزینی: درج: حذف. هر مقدار تا 1000 (CLR:
10:60:30, CCS:6:21:73).

-- دانه برای یک مولد اعداد شبه تصادفی (زمان یونیکس).

گزینه برای مبتنی بر نمونه گیری شبیه سازی
--sample-fastq
فایل با فرمت FASTQ برای نمونه.

--sample-profile-id
شناسه نمایه نمونه-fastq (فیلتر شده). هنگام استفاده از --sample-fastq، نمایه ذخیره می شود.
نمونه_پروفایل_ .fastqو نمونه_پروفایل_ _.آمار بوجود آمدند. وقتی که نه
با استفاده از --sample-fastq، نمایه دوباره استفاده می شود. توجه داشته باشید که وقتی از پروفایل استفاده می شود،
- طول - حداقل، حداکثر, -- دقت - حداقل، حداکثر مانند نمایه خواهد بود.

گزینه برای مبتنی بر مدل شبیه سازی
--model_qc
مدل کد کیفیت

--طول-متوسط
میانگین طول مدل (CLR: 3000.0، CCS:450.0).

--length-sd
مدل انحراف استاندارد طول (CLR: 2300.0، CCS: 170.0).

-- دقت - میانگین
میانگین دقت مدل (CLR: 0.78، CCS: ثابت به عنوان 0.98). این گزینه قابل استفاده است
فقط در مورد CLR.

--accuracy-sd
مدل انحراف استاندارد دقت (CLR: 0.02، CCS: ثابت به عنوان 0.02). این گزینه
فقط در مورد CLR قابل استفاده است.

مثال ها


برای اجرای شبیه سازی مبتنی بر مدل:

pbsim --data-type CLR
- عمق 20
--model_qc /usr/share/pbsim/models/model_qc_clr
مرجع.fasta

در مثال بالا، توالی های خواندن شبیه سازی شده به طور تصادفی از یک مرجع نمونه برداری می شوند
توالی ("reference.fasta") و تفاوت (خطاها) از نمونه خوانده شده معرفی شده است.
نوع داده CLR و عمق پوشش 20 است. اگر دنباله مرجع فایل چند FASTA باشد،
داده های شبیه سازی شده برای هر FASTA ایجاد می شود. برای هر کدام سه فایل خروجی ایجاد می شود
FASTA. "sd_0001.ref" یک فایل تک FASTA است که از دنباله مرجع کپی شده است.
"sd_0001.fastq" یک مجموعه داده خواندنی شبیه سازی شده در قالب FASTQ است. "sd_0001.maf" یک لیست است
تراز بین دنباله مرجع و قرائت های شبیه سازی شده در قالب MAF. طول
و دقت خواندن بر اساس مدل خواندن PacBio ما شبیه سازی شده است.

برای اجرای شبیه سازی مبتنی بر نمونه برداری:

pbsim --data-type CLR
- عمق 20
--sample-fastq sample.fastq
مرجع.fastaq

در شبیه‌سازی مبتنی بر نمونه‌برداری، طول خواندن و امتیاز کیفیت همان a است
به طور تصادفی در مجموعه داده PacBio نمونه ("sample.fastq") خوانده می شود.

با استفاده از خدمات onworks.net از pbsim آنلاین استفاده کنید



جدیدترین برنامه های آنلاین لینوکس و ویندوز