АнглийскийФранцузскийИспанский

Ad


Значок OnWorks

bgzip - Интернет в облаке

Запустите bgzip в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда bgzip, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


bgzip - Утилита сжатия / распаковки блоков

tabix - Универсальный индексатор для файлов положения генома с разделителями TAB

СИНТАКСИС


bgzip [-cdhB] [-b виртуальное смещение] [-s размер] [файл]

табикс [-0лф] [-p gff | кровать | sam | vcf] [-s seqCol] [-b BegCol] [-e конец столбца] [-S LineSkip] [-c
метачар] in.tab.bgz [регион1 [регион2 [...]]]

ОПИСАНИЕ


Tabix индексирует файл положения генома с разделителями TAB in.tab.bgz и создает индексный файл (
в.tab.bgz.tbi or в.tab.bgz.csi ) когда область отсутствует в командной строке. Вход
файл данных должен быть отсортирован по положению и сжат bgzip который имеет GZIP(1) нравится
интерфейс. После индексации tabix может быстро извлекать перекрывающиеся строки данных.
районы указывается в формате «chr: beginPos-endPos». Быстрый поиск данных также работает над
сеть, если в качестве имени файла указан URI, и в этом случае будет загружен индексный файл
если его нет локально.

ИНДЕКСИРОВАНИЕ ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


-0, - с нулевым отсчетом
Укажите, что позиция в файле данных начинается с 0 (например, файлы UCSC), а не
чем 1 на основе.

-б, --начинать INT
Столбец начальной хромосомной позиции. [4]

-с, --комментарий CHAR
Пропускать строки, начинающиеся с символа CHAR. [#]

-С, --csi Пропускать строки, начинающиеся с символа CHAR. [#]

-е, --конец INT
Столбец конечной хромосомной позиции. Конечный столбец может быть таким же, как и начальный.
столбец. [5]

-ф, --сила
Принудительно перезаписать индексный файл, если он присутствует.

-м, --мин-сдвигINT
установить минимальный размер интервала для индексов CSI равным 2 ^ INT [14]

-п, --предустановка STR
Формат ввода для индексации. Допустимые значения: gff, bed, sam, vcf. Этот вариант
не следует применять вместе с любым из -s, -b, -e, -c и -0; это не используется
для извлечения данных, поскольку этот параметр хранится в индексном файле. [gff]

-с, --последовательность INT
Столбец названия последовательности. Вариант -s, -b, -e, -S, -c и -0 все хранятся в
индексный файл и, следовательно, не используется при поиске данных. [1]

-С, -скип-линии INT
Пропустить первые строки INT в файле данных. [0]

ЗАПРОС И ДРУГИЕ ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


-час, --print-заголовок
Распечатайте также строки заголовка / мета.

-ЧАС, --только-заголовок
Печатать только строки заголовка / мета.

-я, - информация о файле
Распечатать информацию о формате файла.

-л, --список-хромов
Перечислите имена последовательностей, хранящиеся в индексном файле.

-р, --reheader ФАЙЛОВ
Замените заголовок содержимым ФАЙЛА

-Р, - регионы ФАЙЛОВ
Ограничить регионами, указанными в ФАЙЛЕ. ФАЙЛ может быть файлом BED (требуется .bed,
.bed.gz, расширение имени файла .bed.bgz) или файл с разделителями TAB с CHROM, POS,
и, необязательно, столбцы POS_TO, где позиции начинаются с 1 включительно. Когда
эта опция используется, входной файл не может быть отсортирован. регионы.

-Т, --цели ФАЙЛОВ
Похожий на что -R но весь ввод будет прочитан последовательно, а регионы не указаны
в ФАЙЛЕ будут пропущены.

ПРИМЕР


(grep ^ "#" in.gff; grep -v ^ "#" in.gff | sort -k1,1 -k4,4n) | bgzip> sorted.gff.gz;

tabix -p gff sorted.gff.gz;

tabix sorted.gff.gz chr1: 10,000,000-20,000,000;

ПРИМЕЧАНИЯ


С помощью стандартного индекса B-дерева (с помощью или
без биннинга), реализованный во всех базах данных SQL, или индекс R-tree в PostgreSQL и
Oracle. Но есть еще много причин использовать табикс. Во-первых, tabix напрямую работает с
множество широко используемых форматов с разделителями табуляции, таких как GFF / GTF и BED. Нам не нужно
разработать схему базы данных или специализированные двоичные форматы. Данные не нужно дублировать в
разные форматы тоже. Во-вторых, tabix работает со сжатыми файлами данных, в то время как большинство SQL
баз данных нет. Аннотацию GenCode GTF можно сжать до 4%. В-третьих, tabix
быстро. Известно, что тот же алгоритм индексации эффективно работает для выравнивания с
несколько миллиардов коротких чтений. Базы данных SQL, вероятно, не могут легко обрабатывать данные в таком масштабе.
И последнее, но не менее важное: tabix поддерживает удаленный поиск данных. Можно положить файл данных
и индекс на сервере FTP или HTTP, и другие пользователи или даже веб-службы смогут
чтобы получить фрагмент без загрузки всего файла.

Используйте bgzip онлайн с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

  • 1
    Pharser
    Pharser
    Phaser - это быстрый, бесплатный и увлекательный
    исходный игровой фреймворк HTML5, который предлагает
    WebGL и рендеринг Canvas через
    настольные и мобильные веб-браузеры. Игры
    может быть со ...
    Скачать Фазер
  • 2
    VASSAL Двигатель
    VASSAL Двигатель
    VASSAL - игровой движок для создания
    электронные версии традиционной доски
    и карточные игры. Он обеспечивает поддержку
    рендеринг и взаимодействие игровых элементов,
    и ...
    Скачать движок VASSAL
  • 3
    OpenPDF - форк iText
    OpenPDF - форк iText
    OpenPDF — это библиотека Java для создания
    и редактирование PDF-файлов с помощью LGPL и
    Лицензия с открытым исходным кодом MPL. OpenPDF – это
    LGPL/MPL преемник iText с открытым исходным кодом,
    и ...
    Скачать OpenPDF — форк iText
  • 4
    SAGA GIS
    SAGA GIS
    САГА - Автоматизированная система
    Геонаучный анализ - это географический
    Программное обеспечение информационной системы (ГИС) с
    огромные возможности для геоданных
    обработка и анализ ...
    Скачать ГИС САГА
  • 5
    Панель инструментов для Java / JTOpen
    Панель инструментов для Java / JTOpen
    IBM Toolbox for Java / JTOpen — это
    библиотека классов Java, поддерживающая
    клиент/сервер и интернет-программирование
    моделей в систему под управлением OS/400,
    i5/ОС, о...
    Скачать набор инструментов для Java/JTOpen
  • 6
    D3.js
    D3.js
    D3.js (или D3 для документов, управляемых данными)
    это библиотека JavaScript, которая позволяет вам
    для создания динамических интерактивных данных
    визуализации в веб-браузерах. С D3
    вы...
    Скачать D3.js
  • Больше »

Команды Linux

Ad