Це команда htseq-qa, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS.
ПРОГРАМА:
ІМ'Я
htseq-qa - Виконайте просту оцінку якості високошвидкісного секвенування
Сценарій Python htseq-qa приймає файл із послідовним читанням (необробленим або вирівняним
reads) і створює PDF-файл із корисними графіками для оцінки технічної якості прогону.
ПЛОТ
Ось типовий сюжет: [зображення]
Графік складається з файлу SAM, який містив вирівняні та невирівняні зчитування. Ліворуч
стовпець робиться з невирівняного, правий стовпець із вирівняного читає. Заголовок
інформує про назву файлу SAM та кількість прочитань.
Верхній рядок показує, як часто яку базу викликали для кожної позиції в зчитуванні. У цьому
зразка, невирівнювані зчитування мають явний перевищення в A. Вирівняні зчитування мають баланс
між доповнювальними читаннями: A і C (червонуваті кольори) мають рівні рівні, а також C і
G (зеленуватого кольору). Послідовності, здається, багаті на AT. Більше того, майже всі вирівняні
читання починаються з T, за яким слідує A, а потім C у 70% і A в 30% читань.
Такий дисбаланс буде приводом для занепокоєння, якщо він не має належного пояснення. Ось,
Причина в тому, що фрагментація зразка була здійснена шляхом ферментного перетравлення.
Нижня половина показує велику кількість оцінок якості базових викликів на різних позиціях
в прочитаному. Майже всі вирівняні зчитування мають якість 34 по всій довжині, тоді як
для невирівняних читань деякі читання мають нижчі показники якості в кінці.
ВИКОРИСТАННЯ
Зверніть увагу, що htseq-qa для створення графіка потрібен matplotlib, тому вам потрібно встановити його
модуль, як описано тут на веб-сайті matplotlib.
Після встановлення HTSeq (див встановлювати) і matplotlib, ви можете запустити htseq-qa від
командний рядок:
htseq-qa [параметри] read_file
Якщо файл htseq-qa не на вашому шляху, ви можете, як альтернатива, викликати сценарій за допомогою
python -m HTSeq.scripts.qa [параметри] read_file
Команда read_file це файл FASTQ або файл SAM. Для файлу SAM — графік із двома
columns створюється, як вище, для файлу FASTQ ви отримуєте лише один стовпець.
Вихідні дані записуються у файл з тим же ім'ям, що й read_file, із суфіксом . Pdf
додано. Перегляньте його за допомогою засобу перегляду PDF, наприклад Acrobat Reader.
Опції
-t , --type=
Тип файлу read_file. Підтримувані значення для є:
· Сем: файл SAM (Зверніть увагу, що файл SAMtools містять Perl-скрипти, щоб конвертувати більшість
вирівнювання форматів до SAM)
· солекса-експорт: a _export.txt файл, створений програмним забезпеченням SolexaPipeline
після приєднання до Eland (htseq-qa очікує нового якісного кодування Solexa як
вироблено версією 1.3 або новішої SolexaPipeline)
· fastq: файл FASTQ зі стандартним (Sanger або Phred) кодуванням якості
· solexa-fastq: файл FASTQ з якісним кодуванням Solexa, створеним
SolexaPipeline після базового виклику з дрохою (htseq-qa очікує нову Solexa
якісне кодування відповідно до версії 1.3 або новішої SolexaPipeline)
-o , --outfile=
ім'я вихідного файлу (за замовчуванням ``.pdf`)
-r , --довжина читання=
максимальна довжина читання (якщо не вказано, сценарій вгадує з файлу
-g , --гама=
гамма-фактор для коригування контрасту графіка якості
-n, --розкол
не розділяйте читання на невирівняне та вирівняне, тобто створюйте діаграму з одним стовпцем
-м, --maxqual
максимальний показник якості, який відображається в даних (за замовчуванням: 40)
-h, --допомога
Показати підсумок використання та вийти
Використовуйте htseq-qa онлайн за допомогою служб onworks.net
