bgzip - Bulutta Çevrimiçi

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen bgzip komutudur.

Program:

ADI


bgzip - Sıkıştırma/açma yardımcı programını engelle

tabix - SEKME ile ayrılmış genom konum dosyaları için genel dizin oluşturucu

SİNOPSİS


bgzip [-cdhB] [-b sanalOfset] [-s boyut] [dosya]

tabix [-0lf] [-p gff|yatak|sam|vcf] [-s sıra Col] [-b yalvarıyorum] [-e bitişCol] [-S satır atla] [-c
metaKarakter] in.tab.bgz [region1 [region2 [...]]]

TANIM


Tabix, TAB ile sınırlandırılmış bir genom konum dosyasını indeksler in.tab.bgz ve bir dizin dosyası oluşturur (
in.tab.bgz.tbi or in.tab.bgz.csi ) ne zaman bölge komut satırında yoktur. Girdi
veri dosyası konuma göre sıralanmalı ve sıkıştırılmalıdır bgzip ki bir gzip(1 Beğeni
arayüz. İndekslemeden sonra tabix, çakışan veri satırlarını hızlı bir şekilde alabilir
bölgeler "chr:beginPos-endPos" biçiminde belirtilir. Hızlı veri alımı da çalışır
dosya adı olarak URI verilmişse ağ ve bu durumda dizin dosyası indirilecektir.
yerel olarak mevcut değilse.

İNDEKSLEME SEÇENEKLER


-0, --sıfır tabanlı
Veri dosyasındaki konumun 0 tabanlı olduğunu belirtin (örn. UCSC dosyaları)
1 tabanlı daha.

-B, --başlamak INT
Başlangıç ​​kromozomal konumu sütunu. [4]

-C, --Yorum TANK
CHAR karakteriyle başlayan satırları atla. [#]

-C, --csi CHAR karakteriyle başlayan satırları atla. [#]

, -e --son INT
Uç kromozomal pozisyon sütunu. Bitiş sütunu başlangıçla aynı olabilir
kolon. [5]

-F, --Kuvvet
Varsa, dizin dosyasının üzerine yazmaya zorlayın.

-M, --min-shiftINT
CSI endeksleri için minimum aralık boyutunu 2^INT [14] olarak ayarlayın

-P, --ön ayar STR
İndeksleme için giriş formatı. Geçerli değerler: gff, bed, sam, vcf. Bu seçenek
ile birlikte uygulanmamalıdır. -s, -b, -e, -c ve -0; kullanılmaz
Bu ayar dizin dosyasında saklandığından veri alımı için. [gff]

-Evet, --sıra INT
Sıra adı sütunu. Seçenek -s, -b, -e, -S, -c ve -0 hepsi şurada saklanır
dizin dosyasıdır ve bu nedenle veri alımında kullanılmaz. [1]

S, --atlama satırları INT
Veri dosyasındaki ilk INT satırlarını atlayın. [0]

SORGULAMA VE DİĞER SEÇENEKLER


-H, --baskı-başlık
Başlık/meta satırlarını da yazdırın.

-H, --sadece-başlık
Yalnızca üstbilgi/meta satırlarını yazdırın.

-ben, --dosya bilgisi
Dosya biçimi bilgilerini yazdırın.

-ben, --list-kromlar
Dizin dosyasında saklanan dizi adlarını listeleyin.

-R, --yeniden başlık DOSYA
Başlığı DOSYA içeriğiyle değiştirin

-R, --bölgeler DOSYA
DOSYA'da listelenen bölgelerle kısıtlayın. DOSYA BED dosyası olabilir (.bed gerektirir,
.bed.gz, .bed.bgz dosya adı uzantısı) veya CHROM, POS ile SEKME ile ayrılmış bir dosya,
ve isteğe bağlı olarak, pozisyonların 1 tabanlı ve kapsayıcı olduğu POS_TO sütunları. Ne zaman
bu seçenek kullanımda, girdi dosyası sıralanamayabilir. bölgeler.

-T, --hedefler DOSYA
Benzer -R ancak tüm girdi sırayla okunacak ve listelenmeyen bölgeler
DOSYA içinde atlanacak.

ÖRNEK


(grep ^"#" in.gff; grep -v ^"#" in.gff | sıralama -k1,1 -k4,4n) | bgzip > sorted.gff.gz;

tabix -p gff sıralanmış.gff.gz;

tabix sorted.gff.gz chr1:10,000,000-20,000,000;

NOTLAR


Standart B-ağacı indeksini (ile veya
binning olmadan) tüm SQL veritabanlarında veya PostgreSQL'de R-tree indeksinde uygulanır ve
Oracle. Ancak tabix'i kullanmak için hala birçok neden var. İlk olarak, tabix ile doğrudan çalışır
GFF/GTF ve BED gibi yaygın olarak kullanılan birçok TAB ile ayrılmış biçim. ihtiyacımız yok
veritabanı şeması veya özel ikili biçimler tasarlayın. Verilerin kopyalanması gerekmez
ya farklı formatlar. İkincisi, tabix sıkıştırılmış veri dosyaları üzerinde çalışırken çoğu SQL
veritabanları yok. GenCode ek açıklaması GTF, %4'e kadar sıkıştırılabilir. Üçüncüsü, tabix
hızlı. Aynı indeksleme algoritmasının, bir hizalama için verimli bir şekilde çalıştığı bilinmektedir.
birkaç milyar kısa okuma. SQL veritabanları muhtemelen bu ölçekte verileri kolayca işleyemez.
Son olarak tabix, uzaktan veri alımını destekler. Veri dosyasını koyabilirsiniz
ve bir FTP veya HTTP sunucusundaki dizin ve diğer kullanıcılar ve hatta web hizmetleri
tüm dosyayı indirmeden bir dilim almak için.

onworks.net hizmetlerini kullanarak bgzip'i çevrimiçi kullanın



En yeni Linux ve Windows çevrimiçi programları