Це команда pbsim, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS
ПРОГРАМА:
ІМ'Я
pbsim - симулятор для читання послідовності PacBio
СИНТАКСИС
pbsim опції
ОПИС
Команда pbsim Команда створює змодельовані зчитування PacBio для довідкової послідовності FASTA
.
Файли моделей (параметри для --модель-qc варіант) можна знайти в
/usr/share/pbsim/models каталог.
ВАРІАНТИ
Варіанти для pbsim можна розділити на загальні, на основі вибірки та на основі моделі
варіанти моделювання.
Загальне опції
--префікс
префікс вихідних файлів (sd).
--тип даних
тип даних. CLR або CCS (CLR).
--глибина
глибина охоплення (CLR: 20.0, CCS: 50.0).
--довжина-хв
мінімальна довжина (100).
--довжина-макс
максимальна довжина (CLR: 25000, CCS: 2500).
--точність-мін
мінімальна точність (CLR: 0.75, CCS: фіксується як 0.75). Цей параметр можна використовувати тільки в
випадок CLR.
--точність-макс
максимальна точність (CLR: 1.00, CCS: фіксується як 1.00). Цей параметр можна використовувати тільки в
випадок CLR.
--відношення різниці
співвідношення відмінностей. заміна:вставка:видалення. Кожне значення до 1000 (CLR:
10:60:30, CCS:6:21:73).
--насіння для генератора псевдовипадкових чисел (час Unix).
Опції та цінності на основі вибірки моделювання
--sample-fastq
Файл формату FASTQ для зразка.
--зразок-ідентифікатор профілю
sample-fastq (відфільтрований) ідентифікатор профілю. При використанні --sample-fastq, профіль зберігається.
sample_profile_ .fastq та sample_profile_ _.статистика створюються. Коли ні
використання --sample-fastq, профіль використовується повторно. Зауважте, що коли використовується профіль,
--довжина-мін,макс, --точність-мін,макс буде таким же, як і профіль.
Опції та цінності на основі моделі моделювання
--model_qc
модель коду якості.
--довжина-середнє
середня модель довжини (CLR: 3000.0, CCS: 450.0).
--довжина-sd
стандартне відхилення моделі довжини (CLR: 2300.0, CCS: 170.0).
--точність-середнє
середнє значення моделі точності (CLR: 0.78, CCS: фіксується як 0.98). Цю опцію можна використовувати
тільки у випадку CLR.
--accuracy-sd
стандартне відхилення моделі точності (CLR: 0.02, CCS: фіксується як 0.02). Цей варіант
можна використовувати лише у випадку CLR.
ПРИКЛАДИ
Щоб запустити моделювання на основі моделі:
pbsim --тип даних CLR \
--глибина 20 \
--model_qc /usr/share/pbsim/models/model_qc_clr \
посилання.fasta
У наведеному вище прикладі змодельовані послідовності зчитування випадковим чином відбираються з посилання
вводиться послідовність ("reference.fasta") і відмінності (помилки) вибіркових читань.
Тип даних — CLR, а глибина охоплення — 20. Якщо опорна послідовність — файл із кількома файлами FASTA,
змодельовані дані створюються для кожного FASTA. Для кожного створюється три вихідні файли
FASTA. "sd_0001.ref" - це один файл FASTA, який скопійовано з послідовності посилань.
"sd_0001.fastq" – це імітований набір даних читання у форматі FASTQ. "sd_0001.maf" - це список
вирівнювання між опорною послідовністю та імітованими зчитуваннями у форматі MAF. Довжина
і точність зчитування моделюються на основі нашої моделі зчитування PacBio.
Щоб запустити моделювання на основі вибірки:
pbsim --тип даних CLR \
--глибина 20 \
--sample-fastq sample.fastq \
reference.fastaq
У моделюванні на основі вибірки довжина зчитування та показник якості такі ж, як у a
читання, взяті випадковим чином у зразку набору даних PacBio ("sample.fastq").
Використовуйте pbsim онлайн за допомогою служб onworks.net