bgzip - Daring di Awan

Ini adalah perintah bgzip yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

PROGRAM:

NAMA


bgzip - Memblokir utilitas kompresi/dekompresi

tabix - Pengindeks generik untuk file posisi genom yang dibatasi TAB

RINGKASAN


bgzip [-cdhB] [-b offset virtual] [-s ukuran] [fillet]

tabix [-0lf] [-p gff|tempat tidur|sam|vcf] [-s seqKol] [-b mohonKol] [-e akhirKol] [-S barisLewati] [-c
metaChar] di.tab.bgz [wilayah1 [wilayah2 [...]]]

DESKRIPSI


Tabix mengindeks file posisi genom yang dibatasi TAB di.tab.bgz dan membuat file indeks (
di.tab.bgz.tbi or di.tab.bgz.csi ) kapan wilayah tidak ada di baris perintah. masukan
file data harus diurutkan posisi dan dikompresi oleh bgzip yang memiliki a gzip(1 Suka
antarmuka. Setelah pengindeksan, tabix dapat dengan cepat mengambil jalur data yang tumpang tindih
daerah ditentukan dalam format "chr:beginPos-endPos". Pengambilan data yang cepat juga berhasil
jaringan jika URI diberikan sebagai nama file dan dalam hal ini file indeks akan diunduh
jika tidak ada secara lokal.

MENGINDEKSI PILIHAN


-0, --berbasis nol
Tentukan bahwa posisi dalam file data berbasis 0 (misalnya file UCSC) bukan
dari 1 berbasis.

-B, --mulai INT
Kolom posisi awal kromosom. [4]

-C, --komentar ARANG
Lewati baris yang dimulai dengan karakter CHAR. [#]

-C, --csi Lewati baris yang dimulai dengan karakter CHAR. [#]

-e, --akhir INT
Kolom posisi kromosom akhir. Kolom akhir bisa sama dengan kolom awal
kolom. [5]

-F, --memaksa
Paksa untuk menimpa file indeks jika ada.

-M, --min-shiftINT
atur ukuran interval minimal untuk indeks CSI ke 2^INT [14]

-P, --setel STR
Format input untuk pengindeksan. Nilai yang valid adalah: gff, bed, sam, vcf. Pilihan ini
tidak boleh diterapkan bersama-sama dengan salah satu dari -s, -b, -e, -c dan -0; itu tidak digunakan
untuk pengambilan data karena pengaturan ini disimpan dalam file indeks. [gff]

-S, --urutan INT
Kolom nama urutan. Pilihan -s, -b, -e, -S, -c dan -0 semua disimpan di
file indeks dan dengan demikian tidak digunakan dalam pengambilan data. [1]

-S, --lewati-baris INT
Lewati baris INT pertama dalam file data. [0]

PERTANYAAN DAN LAIN PILIHAN


-H, --cetak-header
Cetak juga header/meta lines.

-H, --hanya-tajuk
Cetak hanya header/garis meta.

-Saya, --info file
Cetak info format file.

-aku, --daftar-chroms
Daftar nama urutan yang disimpan dalam file indeks.

-R, --tajuk ulang FILE
Ganti header dengan konten FILE

-R, --wilayah FILE
Batasi ke wilayah yang tercantum dalam FILE. FILE dapat berupa file BED (memerlukan .bed,
.bed.gz, ekstensi nama file .bed.bgz) atau file yang dibatasi TAB dengan CHROM, POS,
dan, opsional, kolom POS_TO, di mana posisi berbasis 1 dan inklusif. Kapan
opsi ini sedang digunakan, file input mungkin tidak diurutkan. daerah.

-T, --target FILE
Mirip dengan -R tetapi seluruh input akan dibaca secara berurutan dan wilayah tidak terdaftar
di FILE akan dilewati.

CONTOH


(grep ^"#" in.gff; grep -v ^"#" in.gff | sort -k1,1 -k4,4n) | bgzip > diurutkan.gff.gz;

tabix -p gff diurutkan.gff.gz;

tabix diurutkan.gff.gz chr1:10,000,000-20,000,000;

CATATAN


Sangat mudah untuk mencapai kueri yang tumpang tindih menggunakan indeks B-tree standar (dengan or
tanpa binning) diimplementasikan di semua database SQL, atau indeks R-tree di PostgreSQL dan
Peramal. Tapi masih banyak alasan untuk menggunakan tabix. Pertama, tabix langsung bekerja dengan
banyak format dibatasi TAB yang banyak digunakan seperti GFF/GTF dan BED. Kami tidak perlu
desain skema database atau format biner khusus. Data tidak perlu diduplikasi dalam
format yang berbeda, baik. Kedua, tabix bekerja pada file data terkompresi sementara sebagian besar SQL
database tidak. GTF anotasi GenCode dapat dikompresi hingga 4%. Ketiga, tabix
cepat. Algoritma pengindeksan yang sama diketahui bekerja secara efisien untuk penyelarasan dengan a
beberapa miliar bacaan singkat. Database SQL mungkin tidak dapat dengan mudah menangani data pada skala ini.
Terakhir, tabix mendukung pengambilan data jarak jauh. Seseorang dapat menempatkan file data
dan indeks di server FTP atau HTTP, dan pengguna lain atau bahkan layanan web akan dapat
untuk mendapatkan sepotong tanpa mengunduh seluruh file.

Gunakan bgzip online menggunakan layanan onworks.net



Program online Linux & Windows terbaru