Это команда featureCounts, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
featureCounts - высокоэффективная и точная программа суммирования чтения
ИСПОЛЬЗОВАНИЕ
FeatureCounts [опции] -a -o input_file1 [input_file2]
...
Обязательные аргументы:
-a
Имя файла аннотации. Формат GTF по умолчанию. Видеть -F вариант для большего количества форматов.
-o
Имя выходного файла, включая счетчики чтения. Отдельный файл с резюме
статистика результатов подсчета также включается в вывод (` .резюме')
входные_файлы
Список входных файлов в формате BAM или SAM. Пользователям не нужно указывать, что это BAM или
SAM.
Дополнительные аргументы:
-A
Имя файла с разделителями-запятыми, включая псевдонимы хромосом, используемые для сопоставления
имена хромосом, используемые в аннотации, с теми, которые используются во входных данных BAM / SAM, если они
другой. Информацию о формате файла см. В Руководстве пользователя.
-F
Укажите формат предоставленного файла аннотации. Допустимые форматы включают GTF и
"САФ". По умолчанию GTF. См. Руководство пользователя для описания формата SAF.
-t
Укажите тип объекта в аннотации GTF. exon по умолчанию. Функции, используемые для чтения
подсчет будет извлечен из аннотации с использованием предоставленного значения.
-g
Укажите тип атрибута в аннотации GTF. "gene_id" по умолчанию. Используемые мета-функции
для подсчета чтения будет извлечено из аннотации с использованием предоставленного значения.
-f Выполните подсчет считываний на уровне функций (например, подсчет считываний экзонов, а не
гены).
-O Назначьте чтения всем их перекрывающимся мета-функциям (или функциям, если -f is
указано).
-s
Выполните подсчет чтения для конкретной цепи. Возможные значения: 0 (без переплетения), 1
(скрученный) и 2 (скрученный в обратную сторону). 0 по умолчанию.
-M Также будут учитываться чтения с несколькими отображениями. При чтении с несколькими отображениями все сообщается
выравнивания будут засчитаны. Тег NH на входе BAM / SAM используется для обнаружения
чтение с несколькими отображениями.
-Q
Минимальный балл качества отображения, которому должно соответствовать чтение, чтобы его можно было подсчитать. Для
парные чтения, по крайней мере, один конец должен удовлетворять этому критерию. 0 по умолчанию.
-T
Количество потоков. 1 по умолчанию.
-v Выходная версия программы.
-J Подсчитайте количество чтений, поддерживающих каждое соединение экзон-экзон. Узлы были
идентифицируется из тех считываний, охватывающих экзоны, во входных данных (содержащих 'N' в CIGAR
нить). Результаты подсчета сохраняются в файл с именем ' .jcounts '
-G
Файл Fasta, содержащий эталонный геном, использованный при генерации входной SAM или
Файлы BAM. Этот аргумент нужен только при подсчете соединений.
-R Вывести подробный результат присвоения для каждого чтения. Текстовый файл будет создан для
каждый входной файл, включая имена операций чтения и чтения мета-функций / функций,
назначен. См. Руководство пользователя для получения более подробной информации.
--largestOverlap
Назначьте чтения мета-функции / функции, которая имеет наибольшее количество перекрытий
основы.
--minOverlap
Укажите минимальное количество перекрывающихся баз, необходимых между чтением и
мета-функция / функция, которой назначено чтение. 1 по умолчанию.
--read2pos <5:3>
Уменьшите количество чтений до 5 футов максимальной базы или 3 футов максимальной базы. Затем выполняется подсчет чтения.
на основе единой базы чтение сокращается до.
--readExtension5 Чтения расширены в восходящем направлении на базы из их
5 'конец.
--readExtension3 Чтения расширены в восходящем направлении на базы из их
3 'конец.
--дробная часть
Используйте дробный счет 1 / n вместо 1 (одного) счета для каждого зарегистрированного выравнивания.
чтения с несколькими отображениями при подсчете чтения. n - общее количество заявленных выравниваний
для мульти-отображения читать. Эта опция должна использоваться вместе с опцией "-M".
--начальный
Считайте только первичные выравнивания. Первичные выравнивания идентифицируются с помощью бита 0x100 в
Поле SAM / BAM FLAG.
--ignoreDup
Игнорируйте повторяющиеся чтения при подсчете чтения. Повторяющиеся чтения идентифицируются с помощью бита
Ox400 в поле BAM / SAM FLAG. Вся пара чтения игнорируется, если одно из чтений
повторное чтение парных конечных данных.
--countSplitAlignmentsOnly Подсчитывать только разбивочные выравнивания (т. Е. Выравнивания с
Строка CIGAR, содержащая `N '). Примером расщепленного выравнивания является чтение, охватывающее экзоны.
в данных RNA-seq.
-p Считайте фрагменты (пары чтения) вместо отдельных чтений. Для каждой пары чтения свой
два чтения должны быть рядом друг с другом на входе BAM / SAM.
-P При подсчете пар считывания проверьте правильность расстояния между парными концами. Использовать -d и -D в
установить пороги.
-d
Минимальная длина фрагмента / шаблона, по умолчанию 50.
-D
Максимальная длина фрагмента / шаблона, по умолчанию 600.
-B Подсчитайте только пары чтения, у которых оба конца успешно выровнены.
-S
Укажите ориентацию двух чтений из одной пары, по умолчанию 'fr'
(вперед / назад).
-C Не учитывайте пары чтения, два конца которых соответствуют разным хромосомам.
или сопоставление с той же хромосомой, но на разных цепях.
--донотсорт
Не сортировать чтения во входных данных BAM / SAM. Обратите внимание, что требуется чтение из одной и той же пары.
быть рядом друг с другом на входе.
--maxMOp
Максимальное количество операций 'M', разрешенных в строке CIGAR. 10 по умолчанию. Оба
'X' и '=' обрабатываются как 'M', а смежные операции 'M' объединяются в CIGAR
строка.
Используйте featureCounts онлайн с помощью сервисов onworks.net