İngilizceFransızcaİspanyolca

Ad


OnWorks favicon'u

bcftools - Bulutta Çevrimiçi

Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü üzerinden OnWorks ücretsiz barındırma sağlayıcısında bcftools çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen bcftools komutudur.

Program:

ADI


samtools - Sıra Hizalama/Harita (SAM) formatı için yardımcı programlar

bcftools - İkili Çağrı Formatı (BCF) ve VCF için Yardımcı Programlar

SİNOPSİS


samtools görünümü -bt ref_list.txt -o aln.bam aln.sam.gz

samtools sıralama aln.bam aln.sorted

samtools dizini aln.sorted.bam

samtools idxstats aln.sorted.bam

samtools görünüm aln.sorted.bam chr2:20,100,000-20,200,000

samtools birleştirme out.bam in1.bam in2.bam in3.bam

samtools faidx ref.fasta

samtools yığını -vcf ref.fasta aln.sorted.bam

samtools mpileup -C50 -gf ref.fasta -r chr3:1,000-2,000 in1.bam in2.bam

samtools tview aln.sorted.bam ref.fasta

bcftools dizini in.bcf

bcftools görünümü in.bcf chr2:100-200 > out.vcf

bcftools görünümü -Nvm0.99 in.bcf > out.vcf 2> out.afs

TANIM


Samtools, BAM formatında hizalamaları yöneten bir dizi yardımcı programdır. ithal ediyor
SAM (Sıra Hizalama/Harita) formatından ve dışa aktarır, sıralama, birleştirme ve
indeksleme ve herhangi bir bölgedeki okumaların hızlı bir şekilde alınmasına izin verir.

Samtools, bir akış üzerinde çalışmak üzere tasarlanmıştır. `-' girdi dosyasını standart olarak kabul eder.
girdi (stdin) ve standart çıktı (stdout) olarak bir çıktı dosyası `-'. Birkaç komut olabilir
Böylece Unix boruları ile birleştirilebilir. Samtools her zaman için uyarı ve hata mesajları verir.
standart hata çıktısı (stderr).

Samtools, aşağıdaki durumlarda uzak bir FTP veya HTTP sunucusunda bir BAM (SAM değil) dosyası da açabilir.
BAM dosya adı "ftp://" veya "http://" ile başlar. Samtools mevcut çalışmayı kontrol eder
dizin dosyası için dizin ve yokluğunda dizini indirir. Samtools değil
istenmedikçe tüm hizalama dosyasını alın.

SAMTOOLLAR KOMUTLAR VE SEÇENEKLER


görünüm samtools görünümü [-bchuHS] [-t in.refList] [-o çıktı] [-f reqFlag] [-F skipFlag]
[-q minMapQ] [-l kitaplığı] [-r readGroup] [-R rgFile] | [bölge1
[...]]

Tüm veya alt hizalamaları SAM veya BAM formatında çıkarın/yazdırın. bölge yoksa
belirtilen tüm hizalamalar yazdırılacaktır; aksi halde sadece hizalamalar
belirtilen bölgelerin çakışması çıktısı alınacaktır. Bir hizalama verilebilir
birkaç bölgeyle örtüşüyorsa birden çok kez. Bir bölge sunulabilir,
örneğin, şu biçimde: 'chr2' (chr2'nin tamamı), 'chr2:1000000'
(1,000,000 bp'den başlayan bölge) veya `chr2:1,000,000-2,000,000' (arasındaki bölge)
bitiş noktaları dahil 1,000,000 ve 2,000,000 bp). Koordinat 1 tabanlıdır.

SEÇENEKLER:

-b BAM formatında çıktı.

-f INT Yalnızca FLAG alanında bulunan INT içindeki tüm bitlerle çıkış hizalamaları.
INT, /^0x[0-9A-F]+/ [0] biçiminde onaltılı olabilir

-F INT INT [0] içinde bulunan bitlerle hizalamaları atla

-h Başlığı çıktıya dahil edin.

-H Yalnızca başlık çıktısı alın.

-l STR Yalnızca çıktı STR [null] kitaplığında okunur

-o DOSYA Çıktı dosyası [stdout]

-q INT INT [0] değerinden küçük MAPQ ile hizalamaları atla

-r STR STR [null] okuma grubunda yalnızca çıktı okur

-R DOSYA Listelenen okuma gruplarında çıktı okumaları DOSYA [boş]

-s FLOAT Alt örneklenecek şablonların/çiftlerin oranı; tamsayı kısmı işlenir
rastgele sayı üreteci için tohum olarak [-1]

-S Giriş SAM'de. @SQ başlık satırları yoksa, `-t' seçenektir
gereklidir.

-c Hizalamaları yazdırmak yerine, yalnızca onları sayın ve
toplam sayısı. gibi tüm filtre seçenekleri `-f', `-F' ve `-q' vardır
dikkate alınır.

-t DOSYA Bu dosya SEKME ile ayrılmış. Her satır referans adını içermelidir
ve referansın uzunluğu, her farklı referans için bir satır;
ek alanlar yoksayılır. Bu dosya aynı zamanda siparişin sırasını da tanımlar.
sıralamada referans dizileri. samtools faidx'i çalıştırırsanız ',
sonuçtaki dizin dosyası .fai bu şekilde kullanılabilir
dosyası.

-u Sıkıştırılmamış BAM çıktısı alın. Bu seçenek, harcanan zamandan tasarruf sağlar
sıkıştırma/açma ve bu nedenle çıktı olduğunda tercih edilir
başka bir samtools komutuna yönlendirildi.

izle samtools izle [-p chr:konum] [-s STR] [-d ekran] [ref.fasta]

Metin hizalama görüntüleyici (ncurses kitaplığına dayalı). Görüntüleyicide `?'
yardım için ve formattaki bir bölgeden hizalama başlangıcını kontrol etmek için `g' tuşuna basın.
aynı referansı görüntülerken "chr10:10,000,000" veya "=10,000,000" gibi
sıra.

Seçenekler:

-d ekran (H)tml veya (C)urses veya (T)ext olarak çıktı

-p chr:konum Doğrudan bu pozisyona git

-s STR Yalnızca bu örnekten veya okuma grubundan okumaları görüntüle

yığın samtools mpileup [-EBugp] [-C capQcoef] [-r reg] [-f in.fa] [-l liste] [-M
capMapQ] [-Q minBaseQ] [-q minMapQ] in.bam [in2.bam [...]]

Bir veya birden fazla BAM dosyası için BCF veya yığın oluşturun. Hizalama kayıtları
@RG başlık satırlarında örnek tanımlayıcılara göre gruplandırılmıştır. Örnek tanımlayıcılar ise
yoksa, her girdi dosyası bir örnek olarak kabul edilir.

Yığın formatında (olmadan -uor-g), her satır bir genomik pozisyonu temsil eder,
kromozom adı, koordinat, referans tabanı, okuma tabanları, okuma
nitelikler ve hizalama haritalama nitelikleri. Maç, uyumsuzluk hakkında bilgi,
indel, strand, haritalama kalitesi ve bir okumanın başlangıcı ve bitişinin tümü şu adreste kodlanmıştır:
okuma tabanı sütunu. Bu sütunda, bir nokta referansla eşleşmeyi temsil eder.
ön dizide baz, ters dizide bir eşleşme için virgül, '>' veya
Referans atlama için '<', ileri sarmaldaki bir uyumsuzluk için 'ACGTN' ve
ters iplikte bir uyumsuzluk için 'acgtn'. Bir kalıp `\+[0-9]+[ACGTNacgtn]+'
bu referans konumu ile bir sonraki konum arasında bir ekleme olduğunu gösterir.
referans konumu. Eklemenin uzunluğu, tamsayı tarafından verilir.
desen, ardından eklenen dizi. Benzer şekilde, bir desen
'-[0-9]+[ACGTNacgtn]+' referanstan bir silmeyi temsil eder. silinen
bazlar aşağıdaki satırlarda `*' ile gösterilecektir. Ayrıca okuma üssünde
sütunda, bir `^' sembolü okumanın başlangıcını belirtir. Karakterin ASCII'si
`^' eksi 33'ü takip etmek eşleme kalitesini verir. `$' sembolü sonunu gösterir.
bir okuma bölümü.

Giriş Seçenekler:

-6 Kalitenin Illumina 1.3+ kodlamasında olduğunu varsayın. -A Geçme
varyant çağrısında anormal okuma çiftleri.

-B Tabanın hesaplanması için olasılıksal yeniden hizalamayı devre dışı bırakın
hizalama kalitesi (BAQ). BAQ, bir okumanın Phred ölçekli olasılığıdır.
taban yanlış hizalanmış. Bu seçeneğin uygulanması, azalmaya büyük ölçüde yardımcı olur.
yanlış hizalamalardan kaynaklanan yanlış SNP'ler.

-b DOSYA Giriş BAM dosyalarının listesi, satır başına bir dosya [boş]

-C INT Aşağıdakileri içeren okumalar için eşleme kalitesini düşürme katsayısı
aşırı uyumsuzluklar Phred ölçekli olasılık q ile bir okuma verildiğinde
eşlenen konumdan oluşturulma, yeni eşleme kalitesi
sqrt((INT-q)/INT)*INT ile ilgilidir. Sıfır değeri bunu devre dışı bırakır
işlevsellik; etkinleştirilirse, BWA için önerilen değer 50'dir. [0]

-d INT Bir pozisyonda, maksimum düzeyde okuyun INT giriş BAM başına okur. [250]

-E Genişletilmiş BAQ hesaplaması. Bu seçenek, özellikle aşağıdakiler için hassasiyete yardımcı olur:
MNP'ler, ancak özgüllüğe biraz zarar verebilir.

-f DOSYA The faidx- FASTA formatında indekslenmiş referans dosyası. dosya olabilir
isteğe bağlı olarak sıkıştırılmış razip. [boş]

-l DOSYA BED veya konum listesi dosyası, bölgelerin veya sitelerin bir listesini içerir.
yığın veya BCF oluşturulmalıdır [boş]

-q INT Kullanılacak bir hizalama için minimum eşleme kalitesi [0]

-Q INT Bir baz için dikkate alınması gereken minimum baz kalitesi [13]

-r STR Yalnızca bölgede yığın oluştur STR [tüm siteler]

Çıktı Seçenekler:

-D Örnek başına çıktı okuma derinliği

-g Genotip olasılıklarını hesaplayın ve bunları ikili çağrı formatında çıktılayın
(BCF).

-S Numune başına çıktı Phred ölçekli iplik sapması P değeri

-u Benzer -g çıktının sıkıştırılmamış BCF olması dışında
borulama için tercih edilir.

Opsiyonlar için Genotip Olasılık Hesaplama (için -g or -u):

-e INT Phred ölçekli boşluk uzantısı sıralama hatası olasılığı. azaltmak INT
daha uzun indellere yol açar. [20]

-h INT Homopolimer hatalarını modelleme katsayısı. verilen bir l-uzun
homopolimer çalışması, bir boyut indeksinin sıralama hatası s modellenmiştir
as INT*s/l. [100]

-I INDEL araması yapmayın

-L INT Numune başına ortalama derinlik yukarıdaysa, INDEL aramasını atlayın INT.
[250]

-o INT Phred ölçekli boşluk açık sıralama hatası olasılığı. azaltmak INT yol
daha fazla indel araması için. [40]

-p duyarlılığını artırmak için numune başına -m ve -F eşikleri uygulayın.
arıyor. Varsayılan olarak her iki seçenek de tüm kaynaklardan toplanan okumalara uygulanır.
örnekleri.

-P STR Virgüllü platformlar listesi (belirlenen @RG-PL) olan
indel adayları elde edildi. indel toplamak için tavsiye edilir
düşük indel hata oranına sahip dizileme teknolojilerinden adaylar
ILLUMINA gibi. [herşey]

yeniden başlık samtools yeniden başlık

başlığı değiştirin in.bam başlığı ile in.header.sam. Bu komut
başlığı bir BAM->SAM->BAM dönüşümüyle değiştirmekten çok daha hızlıdır.

kedi samtools kedi [-h başlık.sam] [-o out.bam] [ ... ]

BAM'leri birleştirin. Her BAM girişinin sıra sözlüğü aynı olmalıdır,
bu komut bunu kontrol etmese de. Bu komut şuna benzer bir numara kullanır:
yeniden başlık bu da hızlı BAM birleştirme sağlar.

tür samtools sıralama [-nof] [-m maxMem]

Hizalamaları en soldaki koordinatlara göre sıralayın. Dosya .bam yaratılacak.
Bu komut aynı zamanda geçici dosyalar da oluşturabilir. .%d.bam ne zaman bütün
hizalama belleğe yerleştirilemez ( -m seçeneğiyle kontrol edilir).

SEÇENEKLER:

-o Son hizalamayı standart çıktıya çıkarın.

-n Kromozomal koordinatlara göre değil okunan adlara göre sıralayın

-f kullanım tam çıktı yolu olarak ve ekleme yapmayın .bam soneki.

-m INT Yaklaşık olarak gereken maksimum bellek. [500000000]

birleştirme samtools birleştirme [-nur1f] [-h inh.sam] [-R reg]
[...]

Birden çok sıralanmış hizalamayı birleştirin. Tüm girdilerin başlık referans listeleri
BAM dosyaları ve @SQ üstbilgileri inh.sam, varsa, hepsi aynı anlama gelmelidir
referans dizileri seti. Başlık referans listesi ve (geçersiz kılınmadıkça
-h) `@' başlıkları in1.bam kopyalanacak dışarı.bam, ve diğerlerinin başlıkları
dosyalar yoksayılacak.

SEÇENEKLER:

-1 Çıktıyı sıkıştırmak için zlib sıkıştırma seviyesi 1'i kullanın

-f Varsa çıktı dosyasının üzerine yazmaya zorlayın.

-h DOSYA satırlarını kullanın DOSYA kopyalanacak `@' başlıkları olarak dışarı.bamdeğiştirerek
aksi takdirde kopyalanacak herhangi bir başlık satırı in1.bam. (DOSYA is
aslında SAM biçimindedir, ancak içerebileceği herhangi bir hizalama kaydı
göz ardı edildi.)

-n Girdi hizalamaları, kromozoma göre değil, okunan adlara göre sıralanır.
koordinatları

-R STR ile belirtilen bölgedeki dosyaları birleştir STR [boş]

-r Her hizalamaya bir RG etiketi ekleyin. Etiket değeri dosyadan çıkarılır
isimler.

-u Sıkıştırılmamış BAM çıkışı

indeks samtools dizini

Hızlı rastgele erişim için dizine göre sıralanmış hizalama. dizin dosyası .bai olacak
hazırlandı.

kimlik istatistikleri samtools idxstats

İndeks dosyasındaki istatistikleri alın ve yazdırın. Çıktı, TAB ile sınırlandırılmıştır.
referans dizi adı, dizi uzunluğu, # eşlenmiş okumalardan oluşan her satır
ve # eşlenmemiş okuma.

faidx samtools faidx [bölge1 [...]]

FASTA formatında dizin referans dizisi veya dizinlenmiş dizinden alt diziyi çıkarın
referans dizisi. Bölge belirtilmemişse, faidx dosyayı indeksleyecek ve
yaratmak .fai diskte. Bölgeler belirtilirse, alt diziler
FASTA formatında alınacak ve stdout'a yazdırılacaktır. giriş dosyası olabilir
içinde sıkıştırılmak RAZF biçimi.

düzeltme arkadaşı samtools düzeltme arkadaşı

Montaj ilişkisi koordinatlarını, ISIZE ve montaj ilişkisi ile ilgili bayrakları ada göre sıralanmış bir şekilde doldurun
hizalaması.

rmdup samtools rmdup [-sS]

Olası PCR kopyalarını kaldırın: birden fazla okuma çiftinin aynı harici
koordinatlar, yalnızca en yüksek eşleme kalitesine sahip çifti koruyun. eşleştirilmiş-
bitiş modu, bu komut BİR TEK FR oryantasyonu ile çalışır ve ISIZE gerektirir
doğru ayarlanmış. Eşlenmemiş okumalar için çalışmaz (örn.
farklı kromozomlar veya yetim okumalar).

SEÇENEKLER:

-s Tek uçlu okumalar için kopyayı kaldırın. Varsayılan olarak, komut şunun için çalışır:
yalnızca eşleştirilmiş uç okur.

-S Eşleştirilmiş uçlu okumaları ve tek uçlu okumaları ele alın.

sakinleşmek samtools sakinleştirildi [-EeubSr] [-C capQcoef]

MD etiketini oluşturun. MD etiketi zaten mevcutsa, bu komut bir
oluşturulan MD etiketi mevcut etiketten farklıysa uyarı verir. Çıkış SAM'ı
varsayılan olarak.

SEÇENEKLER:

-A ile birlikte kullanıldığında -r bu seçenek orijinal tabanın üzerine yazar
kalite.

-e Hizalanmış referansla aynıysa, okuma tabanını ='e dönüştürün
temel. Indel arayan şu anda = tabanlarını desteklemiyor.

-u Çıktı sıkıştırılmamış BAM

-b Çıktı sıkıştırılmış BAM

-S Giriş, başlık satırlarıyla SAM'dir

-C INT Kötü eşlenmiş okumaların eşleme kalitesini sınırlama katsayısı. Bkz.
yığmak ayrıntılar için komut. [0]

-r BQ etiketini (-A olmadan) veya temel kaliteyi BAQ ile (-A ile) hesaplayın.

-E Genişletilmiş BAQ hesaplaması. Bu seçenek için özgüllük takas eder
etkisi küçük olsa da duyarlılık.

hedef kesim samtools hedef kesim [-Q minBaseQ] [-i inPenalty] [-0 em0] [-1 em1] [-2 em2] [-f
referans]

Bu komut, okumanın sürekliliğini inceleyerek hedef bölgeleri tanımlar.
derinlik, hedeflerin haploid konsensüs dizilerini hesaplar ve bir SAM çıktısı verir.
her dizi bir hedefe karşılık gelir. Seçenek ne zaman -f kullanımda, BAQ olacak
uygulamalı. Bu komut bir tek fosmidden fosmid klonlarını kesmek için tasarlanmıştır
havuz sıralama [Ref. Kitzman ve ark. (2010)].

faz samtools aşaması [-AF] [-k len] [-b öneki] [-q minLOD] [-Q minBaseQ]

Heterozigot SNP'leri çağırın ve fazlandırın. SEÇENEKLER:

-A Belirsiz faz ile okuma bırakın.

-b STR BAM çıkışının öneki. Bu seçenek kullanımdayken, faz-0 okumaları
dosyaya kaydedildi STR.0.bam ve faz-1 okumaları STR.1.bam. Faz bilinmiyor
okumalar rastgele iki dosyadan birine tahsis edilecektir. kimerik okumalar
geçiş hataları ile kaydedilecek STR.chimeric.bam. [boş]

-F Kimerik okumaları düzeltmeye çalışmayın.

-k INT Yerel fazlama için maksimum uzunluk. [13]

-q INT Heterozigot çağırmak için minimum Phred ölçekli LOD. [40]

-Q INT Het aramada kullanılacak minimum temel kalite. [13]

BCFTTOOLLAR KOMUTLAR VE SEÇENEKLER


görünüm bcftools görünüm [-AbFGNQSucgv] [-D sıraDict] [-l listeLoci] [-s listeÖrnek] [-i
boşlukSN Oranı] [-t MutRate] [-p varThres] [-m varThres] [-P önceki] [-1 nGrup1]
[-d minFrac] [-U nPerm] [-X permÜç] [-T üçlü tip] in.bcf [bölge]

BCF ve VCF arasında dönüştürme, değişken adaylarını çağırma ve alel tahmin etme
frekansları.

Girdi / Çıktı Seçenekler:

-A Varyant sitelerinde tüm olası alternatif alelleri saklayın. Varsayılan olarak,
görünüm komutu olası alelleri atar.

-b BCF formatında çıktı. Varsayılan VCF'dir.

-D DOSYA VCF->BCF dönüşümü için dizi sözlüğü (kromozom adlarının listesi)
[boş]

-F PL'nin r921 tarafından veya daha önce oluşturulduğunu belirtin (sıralama farklıdır).

-G Tüm bireysel genotip bilgilerini bastırın.

-l DOSYA Bilgilerin çıktısı alınan sitelerin listesi [tüm siteler]

-N REF alanının A/C/G/T olmadığı siteleri atlayın

-Q QCALL olasılık biçiminin çıktısını alın

-s DOSYA Kullanılacak örneklerin listesi. Girdideki ilk sütun örneği verir
adları ve ikincisi yalnızca 1 veya 2 olabilen ploidi verir.
2. sütun yoksa, numune ploidinin 2 olduğu varsayılır.
çıktı, numunelerin sıralaması, DOSYA.
[boş]

-S Giriş, BCF yerine VCF'dir.

-u Sıkıştırılmamış BCF çıkışı (kuvvet -b).

fikir birliği/varyant çağrı Seçenekler:

-c Bayes çıkarımını kullanarak değişkenleri çağırın. Bu seçenek otomatik olarak
seçeneği çağırır -e.

-d FLOAT Ne zaman -v kullanımdaysa, kapsadığı numunelerin kesrinin bulunduğu yerleri atlayın.
okuma FLOAT'ın altında. [0]

-e Siteyi tahmin etmek de dahil olmak üzere yalnızca maksimum olasılık çıkarımını gerçekleştirin
alel frekansı, Hardy-Weinberg dengesinin test edilmesi ve test edilmesi
LRT ile dernekler.

-g Varyant sitelerinde örnek başına genotipleri arayın (kuvvet -c)

-i FLOAT INDEL-SNP mutasyon oranı oranı [0.15]

-m FLOAT Gelişmiş çok alelikli ve nadir değişkenli arama için yeni model. Bir diğeri
ALT aleli, LRT'nin P(chi^2) FLOAT eşiğini aşarsa kabul edilir.
Parametre sağlam görünüyor ve gerçek değer genellikle
sonuçları çok etkiler; kullanmak için iyi bir değer 0.99'dur. bu
Önerilen arama yöntemi. [0]

-p FLOAT Bir site, P(ref|D) ise değişken olarak kabul edilir.

-P STR Önceki veya ilk alel frekans spektrumu. STR olabilir tam, koşul2,
düz veya önceki bir varyanttan hata çıktısından oluşan dosya
çalıştırmayı çağırıyor.

-t FLOAT Varyant çağrısı için ölçeklenmiş ses kesme oranı [0.001]

-T STR Eşli/üçlü aramayı etkinleştirin. Üçlü arama için, seçenek -s genellikle
üçlü üyeleri ve sıralamalarını yapılandırmak için uygulanması gerekiyordu.
Seçeneğe verilen dosyada -s, ilk numune olmalıdır
çocuk, ikincisi baba ve üçüncüsü anne. geçerli
değerleri STR 'çift', 'trioauto', 'trioxd' ve 'triox'tur, burada
"pair", iki girdi örneği arasındaki farkları çağırır ve "trioxd"
(`trioxs') girdinin PAR olmayan X kromozomundan olduğunu belirtir
bölgeler ve çocuk bir kadındır (erkek). [boş]

-v Yalnızca çıktı değişken siteleri (kuvvet -c)

Kontrast çağrı ve Dernek test Seçenekler:

-1 INT Grup-1 numune sayısı. Bu seçenek bölmek için kullanılır.
kontrast SNP çağrısı veya ilişki testi için örnekler iki gruba ayrılır.
Bu seçenek kullanımdayken, aşağıdaki VCF INFO çıktısı alınacaktır:
PC2, PCHI2 ve QCHI2. [0]

-U INT İlişkilendirme testi için permütasyon sayısı (yalnızca -1)
[0]

-X FLOAT Yalnızca P(chi^2) için permütasyon gerçekleştirin -U)
[0.01]

indeks bcftools indeks in.bcf

Rastgele erişim için dizine göre sıralanmış BCF.

kedi bcftools kedi in1.bcf [in2.bcf [...]]]

BCF dosyalarını birleştirin. Giriş dosyalarının sıralanması ve
aynı sırayla görünen özdeş örnekler.

SAM FORMAT


Sıra Hizalama/Harita (SAM) formatı SEKME ile sınırlandırılmıştır. Başlık satırları dışında,
`@' sembolü ile başlatıldığında, her bir hizalama çizgisi şunlardan oluşur:

┌────┬─────────────────────────────────────── ────────────────────┐
ColAlanAçıklama
├────┼─────────────────────────────────────── ────────────────────┤
│ 1 │ QNAME │ Sorgu şablonu/çifti ADI │
│ 2 │ BAYRAK │ bitsel BAYRAK │
│ 3 │ RNAME │ Referans dizisi NAME │
│ 4 │ POS │ 1 tabanlı en soldaki KONUM/kırpılmış sıranın koordinatı │
│ 5 │ MAPQ │ Haritalama Kalitesi (Phred ölçekli) │
│ 6 │ CIAGR │ genişletilmiş CIGAR dizisi │
│ 7 │ MRNM │ Montaj İlişkisi Referans dizisi Adı (RNAME ile aynıysa `=') │
│ 8 │ MPOS │ 1-tabanlı Mate POSistion │
│ 9 │ TLEN │ çıkarsanan Şablon UZUNLUĞU (insert boyutu) │
│10 │ SEQ │ Referans ile aynı dizide SEQ sorgusu │
│11 │ KALİTE │ KALİTE sorgusu (ASCII-33, Phred temel kalitesini verir) │
│12+ │ OPT │ değişken ETİKET:VTYPE:VALUE biçimindeki OPSİYONEL alanlar │
└────┴─────────────────────────────────────── ────────────────────┘

BAYRAK alanındaki her bit şu şekilde tanımlanır:

┌─────────────────────────────────────────── ──────────────┐
bayrakM.ÖAçıklama
├─────────────────────────────────────────── ──────────────┤
│0x0001 │ p │ okuma sıralamada eşleştirilir │
│0x0002 │ P │ okunan değer uygun bir çiftte eşlenir │
│0x0004 │ u │ sorgu dizisinin kendisi eşlenmemiş │
│0x0008 │ U │ montaj ilişkisi eşlenmemiş │
│0x0010 │ r │ sorgunun dizisi (ters için 1) │
│0x0020 │ R │ eşin ipliği │
│0x0040 │ 1 │ okuma, bir çiftte ilk okumadır │
│0x0080 │ 2 │ okuma, bir çiftte ikinci okumadır │
│0x0100 │ s │ hizalama birincil değil │
│0x0200 │ f │ okuma platform/satıcı kalite kontrollerinde başarısız oluyor │
│0x0400 │ d │ okunan bir PCR veya optik kopyadır │
└─────────────────────────────────────────── ──────────────┘
burada ikinci sütun, BAYRAK alanının dize temsilini verir.

VCF FORMAT


Varyant Çağrı Formatı (VCF), her bir veri hattının aşağıdakilerden oluştuğu SEKME ile ayrılmış bir formattır.
aşağıdaki alanlar:

┌────┬─────────────────────────────────────── ─────────────────────────┐
ColAlanAçıklama
├────┼─────────────────────────────────────── ─────────────────────────┤
│ 1 │ KROM │ KROMozom adı │
│ 2 │ POS │ varyantın en soldaki KONUMU │
│ 3 │ Kimlik │ benzersiz varyant Tanımlayıcı │
│ 4 │ REF │ REFERANS aleli │
│ 5 │ ALT │ virgülle ayrılmış alternatif alel(ler) │
│ 6 │ KALİTE │ varyant/referans KALİTE │
│ 7 │ FİLTRE │ FİLTRE uygulandı │
│ 8 │ BİLGİ │ Varyantla ilgili bilgi, noktalı virgülle ayrılmış │
│ 9 │ FORMAT │ İki ​​nokta üst üste ile ayrılmış genotip alanlarının FORMATI (isteğe bağlı) │
│10+ │ NUMUNE │ NUMUNE genotipleri ve numune başına bilgi (isteğe bağlı) │
└────┴─────────────────────────────────────── ─────────────────────────┘

Aşağıdaki tablo BILGI samtools ve bcftools tarafından kullanılan etiketler.

┌──────┬───────────────────────────────────── ──────────────────────────────────────────── ───────────────────┐
EtiketoluşturulanAçıklama
├──────┼───────────────────────────────────── ──────────────────────────────────────────── ───────────────────┤
└──────┴───────────────────────────────────── ──────────────────────────────────────────── ───────────────────┘

ÖRNEKLER


o Şu durumlarda SAM'ı BAM'a aktarın: @SQ başlıkta satırlar var:

samtools görünümü -bS aln.sam > aln.bam

If @SQ satırlar yok:

samtools faidx ref.fa
samtools görünümü -bt ref.fa.fai aln.sam > aln.bam

nerede ref.fai.fai tarafından otomatik olarak oluşturulur. faidx Komut.

o Ekle RG sıralanmış hizalamaları birleştirirken etiket:

perl -e 'yazdır
"@RG\tID:ga\tSM:hs\tLB:ga\tPL:Illumina\n@RG\tID:454\tSM:hs\tLB:454\tPL:454\n"' > rg.txt
samtools birleştirme -rh rg.txt birleştirilmiş.bam ga.bam 454.bam

a'daki değer RG etiketi, okumanın geldiği dosya adına göre belirlenir. Bunda
örneğin, içinde birleştirilmiş.bam, okur g.bam eklenecek RG:Z:ga, okurken
454.bam eklenecek RG:Z:454.

o Bir diploid birey için SNP'leri ve kısa INDEL'leri arayın:

samtools mpileup -ugf ref.fa aln.bam | bcftools görünümü -bvcg - > var.raw.bcf
bcftools görünümü var.raw.bcf | vcfutils.pl varFilter -D 100 > var.flt.vcf

The -D varFilter seçeneği, ayarlanması gereken maksimum okuma derinliğini kontrol eder.
ortalama okuma derinliğinin yaklaşık iki katı. Eklemeyi düşünebilirsiniz -C50 için yığın eşleme ise
kalite, aşırı uyumsuzluk içeren okumalar için olduğundan fazla tahmin edilmektedir. Bu seçeneği uygulamak
genellikle yardımcı olur BWA-kısa ancak diğer haritacılar olmayabilir.

o Bir diploid birey için konsensüs dizisini oluşturun:

samtools mpileup -uf ref.fa aln.bam | bcftools görünümü -cg - | vcfutils.pl vcf2fq >
cns.fq

o Bir çift örnekten somatik mutasyonları çağırın:

samtools mpileup -DSuf ref.fa aln.bam | bcftools görünümü -bvcgT çifti - > var.bcf

Çıktı INFO alanında, CLR ile olabilirlik arasındaki Phred-log oranını verir
iki numunenin bağımsız olarak işlenmesi ve genotipin
özdeş olmak. Bu CLR etkili bir şekilde somatik güveni ölçen bir puandır.
aramalar. Ne kadar yüksek o kadar iyi.

o Bir aile üçlüsünden de novo ve somatik mutasyonları arayın:

samtools mpileup -DSuf ref.fa aln.bam | bcftools görünümü -bvcgT çifti -s sample.txt - >
var.bcf

fileto örnekler.txt üye ve sırasını belirten üç satırdan oluşmalıdır.
örnekler (çocuk-baba-anne sırasına göre). Benzer şekilde, CLR Phred-log'u verir
üçlü kısıtlaması olan ve olmayan olasılık oranı. KGÜ en olası olanı gösterir
üçlü kısıtlama olmadan genotip konfigürasyonu ve CGT en olası olanı verir
üçlü kısıtlamayı karşılayan genotip konfigürasyonu.

o Birinci aşama birey:

samtools sakin -AEur aln.bam ref.fa | samtools faz -b öneki - > faz.out

The sakinleşmek komutu, INDEL'ler etrafındaki yanlış heterozigotları azaltmak için kullanılır.

o Birden çok diploid birey için SNP'leri ve kısa indelleri arayın:

samtools mpileup -P ILLUMINA -ugf ref.fa *.bam | bcftools görünümü -bcvg - > var.raw.bcf
bcftools görünümü var.raw.bcf | vcfutils.pl varFilter -D 2000 > var.flt.vcf

Kişiler kimlikten belirlenir SM etiketler @RG başlık satırları bireyler olabilir
tek bir hizalama dosyasında toplanmış; bir kişi birden fazla dosyaya da ayrılabilir.
The -P seçenek, indel adaylarının yalnızca okuma gruplarından toplanması gerektiğini belirtir
ile @RG-PL etiket şuna ayarlandı illumina. Sıralı okumalardan indel adaylarını toplama
indel'e yatkın bir teknoloji, indel çağrısının performansını etkileyebilir.

tarafından çağrılabilecek yeni bir çağrı modeli olduğunu unutmayın.

bcftools görünümü -m0.99 ...

bu, varsayılan yöntemin bazı ciddi sınırlamalarını düzeltir.

Filtreleme için, en iyi sonuçların ilk olarak uygulanmasıyla elde edildiği görülmektedir. SnpGap'i filtre ve
daha sonra bazı makine öğrenimi yaklaşımını uygulamak

vcf-açıklama -f SnpGap=n
vcf filtresi...

Her ikisi de bulunabilir vcftools ve htslib paket (aşağıdaki bağlantılar).

o Alel frekans spektrumunu (AFS) birden fazla kişiden sitelerin bir listesinden türet:

samtools mpileup -Igf ref.fa *.bam > all.bcf
bcftools görünümü -bl siteleri.list all.bcf > siteler.bcf
bcftools görünümü -cGP cond2 siteleri.bcf > /dev/null 2> siteler.1.afs
bcftools görünümü -cGP siteleri.1.afs siteleri.bcf > /dev/null 2> siteler.2.afs
bcftools görünümü -cGP siteleri.2.afs siteleri.bcf > /dev/null 2> siteler.3.afs
......

nerede siteler.listesi her satırı referanstan oluşan sitelerin listesini içerir
sıra adı ve konumu. Devamındaki bcftools komutlar AFS'yi EM ile tahmin eder.

o Diğer SNP arayanlar için Dump BAQ uygulanan hizalama:

samtools -bAr aln.bam > aln.baq.bam

ekler ve düzeltir NM ve MD aynı anda etiketler. NS sakinleşmek komut da gelir
ile -C seçeneğindeki ile aynı yığmak ve yığın. Yardımcı olacaksa uygulayın.

KISITLAMALAR


o bam_import.c, bam_endian.h, bam.c ve bam_aux.c'de kullanılan hizalanmamış kelimeler.

o Samtools eşleştirilmiş uç rmdup, eşleştirilmemiş okumalar için çalışmaz (örn.
farklı kromozomlara eşlenir). Bu bir endişeyse, lütfen Picard'ın
Bu vakaları doğru bir şekilde işleyen MarkDuplicate, biraz daha yavaş olsa da.

onworks.net hizmetlerini kullanarak bcftools'u çevrimiçi kullanın


Ücretsiz Sunucular ve İş İstasyonları

Windows ve Linux uygulamalarını indirin

  • 1
    Firebird
    Firebird
    Firebird RDBMS, ANSI SQL özellikleri sunar
    & Linux, Windows üzerinde çalışır &
    birkaç Unix platformu. Özellikler
    mükemmel eşzamanlılık ve performans
    & güç...
    Firebird'ü indirin
  • 2
    KompoZer
    KompoZer
    KompoZer, aşağıdakileri kullanan bir wysiwyg HTML editörüdür.
    Mozilla Besteci kod tabanı. Olarak
    Nvu'nun gelişimi durduruldu
    2005'te KompoZer birçok hatayı düzeltti ve
    bir f ekler...
    KompoZer'i indirin
  • 3
    Ücretsiz Manga İndiricisi
    Ücretsiz Manga İndiricisi
    Ücretsiz Manga İndiricisi (FMD), bir
    yazılmış açık kaynak uygulama
    Yönetmek için Object-Pascal ve
    çeşitli web sitelerinden manga indirmek.
    Bu bir ayna...
    Ücretsiz Manga İndiriciyi İndirin
  • 4
    UNetbootin
    UNetbootin
    UNetbootin, önyüklenebilir oluşturmanıza olanak tanır
    Ubuntu, Fedora ve için canlı USB sürücüler
    olmayan diğer Linux dağıtımları
    CD yazma. Windows, Linux üzerinde çalışır,
    ve ...
    UNetbootin'i indirin
  • 5
    Dolibar ERP - CRM
    Dolibar ERP - CRM
    Dolibarr ERP - CRM kullanımı kolay
    ERP ve CRM açık kaynak yazılım paketi
    (bir web php sunucusuyla veya
    işletmeler için bağımsız yazılım),
    temeller...
    Dolibarr ERP'yi İndirin - CRM
  • 6
    SQuirreL SQL İstemcisi
    SQuirreL SQL İstemcisi
    SQuirreL SQL Client, grafiksel bir SQL'dir.
    izin verecek Java ile yazılmış istemci
    bir JDBC'nin yapısını görüntülemek için
    uyumlu veritabanı, içindeki verilere göz atın
    masalar...
    SQuirreL SQL İstemcisini İndirin
  • Daha fazla »

Linux komutları

Ad