Це команда cutadapt, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн емулятор Windows або онлайн емулятор MAC OS
ПРОГРАМА:
ІМ'Я
cutadapt - сторінка посібника для cutadapt 1.8.3
ОПИС
cutadapt версія 1.8.3 Copyright © 2010-2015 Marcel Martin[захищено електронною поштою]>
cutadapt видаляє послідовності адаптера з високошвидкісного секвенування.
Використання:
розрізати -a АДАПТЕР [параметри] [-o output.fastq] input.fastq
для парний кінець говорить:
розрізати -a ADAPT1 -A ADAPT2 [параметри] -o out1.fastq -p out2.fastq in1.fastq
in2.fastq
Замініть "АДАПТЕР" фактичною послідовністю вашого 3' адаптера. Символи підстановки IUPAC
підтримуються. Зворотне доповнення *не* шукається автоматично. Усі читання з
input.fastq буде записано в output.fastq з видаленою послідовністю адаптера. адаптер
відповідність стійка до помилок. Можна надати декілька послідовностей адаптерів (використовуйте далі -a
параметри), але буде видалено лише найкращий відповідний адаптер.
Введення також може бути у форматі FASTA. Підтримується стиснений вхід і вихід
автоматично визначається за назвою файлу (.gz, .xz, .bz2). Використовуйте ім’я файлу '-' для стандарту
введення-виведення. Без -o опція, вихідні дані надсилаються на стандартний вихід.
Дещо інший доступний риси є:
* Різні інші типи адаптерів (5' адаптери, "змішані" 5'/3' адаптери тощо) *
Обрізка фіксованої кількості основ * Якісне обрізання * Обрізка колірного простору *
Фільтрування читань за різними критеріями
Використовуйте «cutadapt --допомога", щоб побачити всі параметри командного рядка. Див
http://cutadapt.readthedocs.org/ для повної документації.
ВАРІАНТИ
-- версія
показати номер версії програми та вийти
-h, --допомога
показати це повідомлення довідки та вийти
-f ФОРМАТ, --формат=ФОРМАТ
Формат вхідного файлу; може бути 'fasta', 'fastq' або 'sra-fastq'. Проігноровано коли
читання файлів csfasta/qual (за замовчуванням: автоматичне визначення за розширенням імені файлу).
Параметри, які впливають на пошук адаптерів:
Кожен з наступних трьох параметрів (-a, -b, -g) можна використовувати кілька разів і
в будь-якій комбінації для пошуку цілого набору адаптерів, можливо, різних
типи. Тільки найкращий відповідний адаптер обрізається з кожного прочитаного (але див
--рази варіант). Замість того, щоб давати безпосередньо перехідник, можна ще й написати
file:FILE і послідовності адаптера будуть зчитовані з заданого FILE (який повинен бути
у форматі FASTA).
-a АДАПТЕР, --адаптер=АДАПТЕР
Послідовність адаптера, який був лігований до 3' кінця. Сам адаптер і
все, що слідує, обрізається. Якщо послідовність адаптера закінчується символом "$"
символ, адаптер прив’язується до кінця читання і знайдено, лише якщо це a
суфікс прочитаного.
-g АДАПТЕР, --передня частина=АДАПТЕР
Послідовність адаптера, який був лігований до 5' кінця. Якщо послідовність адаптера
починається з символу '^', адаптер 'закріплений'. Обов’язково закріплений адаптер
з'являються повністю на 5' кінці прочитаного (це префікс прочитаного). А
не закріплений адаптер може частково з’явитися на кінці 5’, або може з’явитися всередині
читати. Якщо він знайдено в межах читання, послідовність, що передує адаптеру, також є
обрізаний. У всіх випадках обрізається сам перехідник.
-b АДАПТЕР, -- будь-де=АДАПТЕР
Послідовність адаптера, який був лігований до 5' або 3' кінця. Якщо адаптер є
знайдено в межах зчитування або перекриває 3'-кінець зчитування, поведінка є
те саме, що і для -a варіант. Якщо адаптер перекриває кінець 5 футів (початок
read), початкова частина читання, що відповідає адаптеру, обрізається, але
все, що йде далі, зберігається.
-e ERROR_RATE, --частота помилок=ERROR_RATE
Максимально дозволений рівень помилок (кількість помилок, поділена на довжину збігу
регіон) (за замовчуванням: 0.1)
--ні інделі
Не допускати інделів у вирівнюваннях (допускати лише невідповідності). Наразі тільки
підтримується для закріплених адаптерів. (за замовчуванням: дозволити як невідповідності, так і indels)
-n РАХУВАТИ, --рази=COUNT
Спробуйте видалити адаптери не більше COUNT разів. Корисно, коли додається адаптер
кілька разів (за замовчуванням: 1).
-O ДОВЖИНА, --накладання=ДОВЖИНА
Мінімальна довжина перекриття. Якщо перекриття між зчитуванням і адаптером коротше
ніж LENGTH, читання не змінюється. Це зменшує номер. основ чисто обрізані
через короткі випадкові збіги адаптера (за замовчуванням: 3).
--match-read-wildcards
Дозволити підстановочні знаки IUPAC в читаннях (за замовчуванням: False).
-N, --no-match-adapter-wildcards
Не інтерпретуйте символи підстановки IUPAC в адаптерах.
Параметри фільтрації оброблених читань:
--відкинути-обрізати, --відкинути
Викиньте зчитування, які містять адаптер, замість того, щоб обрізати їх. Також використовуйте -O in
щоб не викидати занадто багато випадково збігаються читань!
--відкинути-необрізані, --тільки обрізані
Викиньте зчитування, які не містять адаптера.
-m ДОВЖИНА, --мінімальна довжина=ДОВЖИНА
Відкиньте обрізані зчитування, коротші за LENGTH. Читання навіть занадто короткі
перед видаленням адаптера також відкидаються. У кольоровому просторі початковий праймер не є
підраховано (за замовчуванням: 0).
-M ДОВЖИНА, --максимальна довжина=ДОВЖИНА
Викиньте обрізані зчитування, які довші за LENGTH. Читання навіть занадто довгі
перед видаленням адаптера також відкидаються. У кольоровому просторі початковий праймер не є
підраховано (за замовчуванням: без обмежень).
--без обрізки
Зіставте та переспрямуйте читання на вихід/необрізаний вихід, як зазвичай, але не видаляйте
адаптери.
--max-n=ДОВЖИНА
Максимальна частка N, дозволена в читанні. Число < 1 буде розглядатися як a
пропорцію, тоді як число > 1 буде розглядатися як максимальна кількість N
міститься.
--маска-адаптер
Маскуйте адаптери символами "N", а не обрізайте їх.
Параметри, які впливають на те, куди буде виведено:
--спокійно
Не друкуйте звіт в кінці.
-o ФАЙЛ, - вихід=Фото
Записати змінені читання до FILE. Формат FASTQ або FASTA вибирається залежно від введення.
Зведений звіт надсилається на стандартний вихід. Використовуйте '{name}' у FILE для демультиплексування
читає в декілька файлів. (за замовчуванням: обрізані зчитування записуються в стандартний вихід)
--info-файл=Фото
Запишіть інформацію про кожне прочитане та відповідність його адаптера у FILE. Див
документація для формату файлу.
-r ФАЙЛ, --rest-файл=Фото
Коли адаптер збігається в середині читання, напишіть решту (після
адаптер) у FILE.
--файл підстановки=Фото
Якщо адаптер має підстави підстановки ('N), запишіть бази адаптера, що відповідають підстановочним знакам
позиції до FILE. Коли у вирівнюванні є індели, цього часто не буде
точний.
--занадто короткий вихід=Фото
Запишіть надто короткі зчитування (відповідно до довжини, зазначеної в -m) у FILE.
(за замовчуванням: відкинути читання)
--занадто довгий вихід=Фото
Запишіть надто довгі читання (відповідно до довжини, зазначеної в -M) у FILE.
(за замовчуванням: відкинути читання)
--необрізаний вихід=Фото
Запишіть читання, які не містять адаптер, у FILE. (за замовчуванням: виведення в той самий файл
як обрізане читає)
Додаткові зміни до читань:
-u ДОВЖИНА, -- вирізати=ДОВЖИНА
Видаліть підстави LENGTH з початку або кінця кожного зчитування. Якщо LENGTH додатне,
основи видаляються з початку кожного читання. Якщо LENGTH від’ємна, то
основи видаляються з кінця кожного зчитування. Цей параметр можна вказати двічі, якщо
LENGTHs мають різні знаки.
-q [5'CUTOFF,]3'CUTOFF, --відрізання якості=[5'CUTOFF,]3'CUTOFF
Перед видаленням адаптера обріжте низькоякісні основи з 5-ти та/або 3-дюймових кінців зчитування. Якщо
вказано одне значення, лише 3' кінець обрізається. Якщо два відрізки, розділені комами
враховуючи, кінець 5' обрізається першим відрізом, кінець 3' - другим. The
Алгоритм такий самий, як і в BWA (див. документацію). (за замовчуванням: ні
обрізка)
--база якості=QUALITY_BASE
Припустимо, що значення якості закодовані як ascii(якість + QUALITY_BASE). The
за замовчуванням (33) зазвичай правильне, за винятком читань, зроблених деякими версіями
Конвеєр Illumina, де це має бути встановлено на 64. (За замовчуванням: 33)
--обрізка-н
Обріжте N на кінцях зчитування.
-x ПРЕФІКС, --префікс=ПРЕФІКС
Додайте цей префікс, щоб прочитати імена
-y СУФІКС, --суфікс=СУФІКС
Додайте цей суфікс, щоб прочитати імена
--strip-суфікс=STRIP_SUFFIX
Видаліть цей суфікс із прочитаних імен, якщо він є. Можна давати кілька разів.
-c, --кольоровий простір
Режим колірного простору: також обріжте колір, який прилягає до знайденого адаптера.
-d, -- подвійне кодування
Перебуваючи в кольоровому просторі, подвійне кодування кольорів (відображення 0,1,2,3,4 до A,C,G,T,N).
-t, --трим-грунт
Перебуваючи в колірному просторі, обріжте основу ґрунтовки та перший колір (який є перехідним
до першого нуклеотиду)
--strip-f3
Для колірного простору: видаліть суфікс _F3 із прочитаних імен
--maq, --bwa
MAQ- та BWA-сумісний вихідний колірний простір. Це дозволяє -c, -d, -t, --strip-f3 та
-y '/1'.
--тег довжини=TAG
У полі опису прочитаного шукайте ТЕГ із десятковим числом.
Замініть десяткове число правильною довжиною обрізаного зчитування. Для
наприклад, використати --тег довжини 'length=', щоб виправити поля, наприклад 'length=123'.
--no-zero-cap
Не змінюйте негативні значення якості на нуль. Значення якості колірного простору -1
буде відображатися як пробіли у вихідному файлі FASTQ. Оскільки багато інструментів мають проблеми
при цьому негативні якості перетворюються на нуль під час обрізання даних колірного простору.
Використовуйте цей параметр, щоб зберегти негативні якості.
-z, --нульова шапка
Змінити негативні значення якості на нуль. Це ввімкнено за замовчуванням, коли
-c/--колірний простір також увімкнено. Скористайтеся наведеною вище опцією, щоб вимкнути її.
Варіанти парного кінця:
Команда -AПараметри /-G/-B/-U працюють як їхні -a/-b/-g/-u відповідники.
-A АДАПТЕР
3'-адаптер, який потрібно видалити з другого зчитування в парі.
-G АДАПТЕР
5'-адаптер, який потрібно видалити з другого зчитування в парі.
-B АДАПТЕР
Адаптер 5'/3 потрібно видалити з другого зчитування в парі.
-U ДОВЖИНА
Видаліть підстави LENGTH з початку або кінця кожного читання (див -- вирізати).
-p ФАЙЛ, --парний вихід=Фото
Запишіть друге читання в парі до FILE.
--untrimmed-paired-output=Фото
Запишіть друге читання в парі в цей ФАЙЛ, якщо в першому не було знайдено адаптера
читати. Використовуйте цю опцію разом з --необрізаний вихід при обрізанні парного кінця
читає. (За замовчуванням: виведення в той самий файл, що й обрізані читання.)
Використовуйте cutadapt онлайн за допомогою служб onworks.net