Ini ialah arahan bgzip yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
bgzip - Sekat utiliti pemampatan/penyahmampatan
tabix - Pengindeks generik untuk fail kedudukan genom yang dibatasi TAB
SINOPSIS
bgzip [-cdhB] [-b virtualOffset] [-s saiz] [fail]
tabix [-0lf] [-p gff|katil|sam|vcf] [-s seqCol] [-b begCol] [-e endCol] [-S lineSkip] [-c
metaChar] dalam.tab.bgz [rantau1 [rantau2 [...]]]
DESCRIPTION
Tabix mengindeks fail kedudukan genom yang dibatasi TAB dalam.tab.bgz dan mencipta fail indeks (
in.tab.bgz.tbi or in.tab.bgz.csi ) bila rantau tiada dalam baris arahan. Input
fail data mesti diisih kedudukan dan dimampatkan oleh bgzip yang mempunyai a gzip(1) suka
antara muka. Selepas pengindeksan, tabix dapat dengan cepat mendapatkan semula talian data yang bertindih
kawasan dinyatakan dalam format "chr:beginPos-endPos". Pendapatan data pantas juga berfungsi
rangkaian jika URI diberikan sebagai nama fail dan dalam kes ini fail indeks akan dimuat turun
jika ia tidak hadir secara tempatan.
MENGINDEKS PILIHAN
-0, --berasaskan sifar
Tentukan bahawa kedudukan dalam fail data adalah berasaskan 0 (cth fail UCSC).
daripada berasaskan 1.
-b, --mulakan INT
Lajur kedudukan kromosom mula. [4]
-c, --komen CHAR
Langkau baris dimulakan dengan aksara CHAR. [#]
-C, --csi Langkau baris dimulakan dengan aksara CHAR. [#]
-e, --akhir INT
Lajur kedudukan kromosom hujung. Lajur akhir boleh sama dengan permulaan
ruangan. [5]
-f, - kekuatan
Paksa untuk menulis ganti fail indeks jika ia ada.
-m, --min-shiftINT
tetapkan saiz selang minimum untuk indeks CSI kepada 2^INT [14]
-p, --pratetap STR
Format input untuk pengindeksan. Nilai yang sah ialah: gff, katil, sam, vcf. Pilihan ini
tidak boleh digunakan bersama-sama dengan mana-mana -s, -b, -e, -c and -0; ia tidak digunakan
untuk mendapatkan semula data kerana tetapan ini disimpan dalam fail indeks. [gff]
-ya, --urutan INT
Lajur nama jujukan. Pilihan -s, -b, -e, -S, -c and -0 semuanya disimpan dalam
fail indeks dan dengan itu tidak digunakan dalam pengambilan data. [1]
-S, --langkau baris INT
Langkau baris INT pertama dalam fail data. [0]
MENYOALKAN DAN LAIN PILIHAN
-h, --print-header
Cetak juga baris pengepala/meta.
-H, --sahaja-pengepala
Cetak hanya baris pengepala/meta.
-saya, --maklumat-fail
Cetak maklumat format fail.
-l, --list-chroms
Senaraikan nama jujukan yang disimpan dalam fail indeks.
-r, --header FAIL
Gantikan pengepala dengan kandungan FILE
-R, --kawasan FAIL
Hadkan kepada kawasan yang disenaraikan dalam FILE. FILE boleh menjadi fail BED (memerlukan .bed,
sambungan nama fail .bed.gz, .bed.bgz) atau fail yang dibataskan TAB dengan CHROM, POS,
dan, secara pilihan, lajur POS_TO, di mana kedudukan adalah berasaskan 1 dan inklusif. Bila
pilihan ini sedang digunakan, fail input mungkin tidak diisih. wilayah.
-T, --sasaran FAIL
Sama seperti -R tetapi keseluruhan input akan dibaca secara berurutan dan wilayah tidak disenaraikan
dalam FILE akan dilangkau.
CONTOH
(grep ^"#" in.gff; grep -v ^"#" in.gff | sort -k1,1 -k4,4n) | bgzip > sorted.gff.gz;
tabix -p gff sorted.gff.gz;
tabix sorted.gff.gz chr1:10,000,000-20,000,000;
NOTA
Ia adalah mudah untuk mencapai pertanyaan bertindih menggunakan indeks B-tree standard (dengan atau
tanpa binning) dilaksanakan dalam semua pangkalan data SQL, atau indeks R-tree dalam PostgreSQL dan
Oracle. Tetapi masih terdapat banyak sebab untuk menggunakan tabix. Pertama, tabix secara langsung berfungsi dengan
banyak format yang dibataskan TAB yang digunakan secara meluas seperti GFF/GTF dan BED. Kita tidak perlu
reka bentuk skema pangkalan data atau format binari khusus. Data tidak perlu diduplikasi
format yang berbeza, sama ada. Kedua, tabix berfungsi pada fail data termampat manakala kebanyakan SQL
pangkalan data tidak. Anotasi GenCode GTF boleh dimampatkan kepada 4%. Ketiga, tabix
adalah pantas. Algoritma pengindeksan yang sama diketahui berfungsi dengan cekap untuk penjajaran dengan a
beberapa bilion bacaan pendek. Pangkalan data SQL mungkin tidak boleh mengendalikan data dengan mudah pada skala ini.
Akhir sekali, tabix menyokong pengambilan data jauh. Seseorang boleh meletakkan fail data
dan indeks pada pelayan FTP atau HTTP, dan pengguna lain atau perkhidmatan web akan dapat
untuk mendapatkan kepingan tanpa memuat turun keseluruhan fail.
Gunakan bgzip dalam talian menggunakan perkhidmatan onworks.net