EnglishFrenchSpanyol

Ad


Favicon OnWorks

bcftools - Dalam Talian di Awan

Jalankan bcftools dalam penyedia pengehosan percuma OnWorks melalui Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS

Ini ialah arahan bcftools yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.

JADUAL:

NAMA


samtools - Utiliti untuk format Penjajaran Jujukan/Peta (SAM).

bcftools - Utiliti untuk Format Panggilan Binari (BCF) dan VCF

SINOPSIS


samtools view -bt ref_list.txt -o aln.bam aln.sam.gz

samtools sort aln.bam aln.sorted

indeks samtools aln.sorted.bam

samtools idxstats aln.sorted.bam

samtools view aln.sorted.bam chr2:20,100,000-20,200,000

samtools bergabung keluar.bam in1.bam in2.bam in3.bam

samtools faidx ref.fasta

samtools pileup -vcf ref.fasta aln.sorted.bam

samtools mpileup -C50 -gf ref.fasta -r chr3:1,000-2,000 in1.bam in2.bam

samtools tview aln.sorted.bam ref.fasta

indeks bcftools dalam.bcf

bcftools lihat in.bcf chr2:100-200 > out.vcf

paparan bcftools -Nvm0.99 in.bcf > out.vcf 2> out.afs

DESCRIPTION


Samtools ialah satu set utiliti yang memanipulasi penjajaran dalam format BAM. Ia mengimport
dari dan eksport ke format SAM (Penjajaran Jujukan/Peta), melakukan pengisihan, penggabungan dan
pengindeksan, dan membolehkan untuk mendapatkan semula bacaan di mana-mana kawasan dengan pantas.

Samtools direka untuk berfungsi pada aliran. Ia menganggap fail input `-' sebagai standard
input (stdin) dan fail output `-' sebagai output standard (stdout). Beberapa arahan boleh
dengan itu digabungkan dengan paip Unix. Samtools sentiasa mengeluarkan amaran dan mesej ralat ke
output ralat piawai (stderr).

Samtools juga boleh membuka fail BAM (bukan SAM) pada pelayan FTP atau HTTP jauh jika
Nama fail BAM bermula dengan `ftp://' atau `http://'. Samtools menyemak kerja semasa
direktori untuk fail indeks dan akan memuat turun indeks apabila tiada. Samtools tidak
dapatkan semula keseluruhan fail penjajaran melainkan ia diminta berbuat demikian.

SAMTOOLS PERINTAH DAN PILIHAN


pandangan paparan samtools [-bchuHS] [-t in.refList] [-o output] [-f reqFlag] [-F skipFlag]
[-q minMapQ] [-l perpustakaan] [-r readGroup] [-R rgFile] | [wilayah1
[...]]

Ekstrak/cetak semua atau sub penjajaran dalam format SAM atau BAM. Jika tiada wilayah
ditentukan, semua penjajaran akan dicetak; sebaliknya hanya penjajaran
bertindih kawasan yang ditentukan akan dikeluarkan. Penjajaran boleh diberikan
beberapa kali jika ia bertindih beberapa wilayah. Suatu wilayah boleh dibentangkan,
contohnya, dalam format berikut: `chr2' (keseluruhan chr2), `chr2:1000000'
(rantau bermula dari 1,000,000bp) atau `chr2:1,000,000-2,000,000' (wilayah antara
1,000,000 dan 2,000,000bp termasuk titik akhir). Koordinat adalah berasaskan 1.

PILIHAN:

-b Output dalam format BAM.

-f INT Hanya penjajaran output dengan semua bit dalam INT hadir dalam medan FLAG.
INT boleh dalam hex dalam format /^0x[0-9A-F]+/ [0]

-F INT Langkau penjajaran dengan bit yang terdapat dalam INT [0]

-h Sertakan pengepala dalam output.

-H Keluarkan pengepala sahaja.

-l STR Hanya output dibaca dalam perpustakaan STR [null]

-o FAIL Fail output [stdout]

-q INT Langkau penjajaran dengan MAPQ lebih kecil daripada INT [0]

-r STR Hanya output dibaca dalam kumpulan baca STR [null]

-R FAIL Output dibaca dalam kumpulan baca yang disenaraikan dalam FAIL [null]

-s FLOAT Pecahan templat/pasangan kepada subsampel; bahagian integer dirawat
sebagai benih untuk penjana nombor rawak [-1]

-S Input adalah dalam SAM. Jika baris pengepala @SQ tiada, baris `-t' pilihan adalah
diperlukan.

-c Daripada mencetak penjajaran, hanya mengiranya dan mencetaknya
jumlah nombor. Semua pilihan penapis, seperti `-f', `-F' and `-q' , adalah
diambil kira.

-t FAIL Fail ini dibataskan TAB. Setiap baris mesti mengandungi nama rujukan
dan panjang rujukan, satu baris untuk setiap rujukan yang berbeza;
medan tambahan diabaikan. Fail ini juga mentakrifkan susunan
urutan rujukan dalam pengisihan. Jika anda menjalankan `samtools faidx ',
fail indeks yang terhasil .fai boleh digunakan seperti ini
fail.

-u Keluarkan BAM yang tidak dimampatkan. Pilihan ini menjimatkan masa yang dibelanjakan
mampatan/penyahmampatan dan dengan itu diutamakan apabila outputnya
disalurkan ke arahan samtools yang lain.

tvview samtools tview [-p chr:pos] [-s STR] [-d memaparkan] [ref.fasta]

Pemapar penjajaran teks (berdasarkan perpustakaan ncurses). Dalam pemapar, tekan `?'
untuk mendapatkan bantuan dan tekan `g' untuk menyemak penjajaran bermula dari rantau dalam format
seperti `chr10:10,000,000' atau `=10,000,000' apabila melihat rujukan yang sama
urutan.

Pilihan:

-d memaparkan Output sebagai (H)tml atau (C)urses atau (T)ext

-p chr:pos Pergi terus ke kedudukan ini

-s STR Paparkan hanya bacaan daripada sampel ini atau kumpulan baca

mpileup samtools mpileup [-EBugp] [-C capQcoef] [-r reg] [-f dalam.fa] [-l senarai] [-M
capMapQ] [-Q minBaseQ] [-q minMapQ] dalam.bam [in2.bam [...]]

Hasilkan BCF atau timbunan untuk satu atau berbilang fail BAM. Rekod penjajaran adalah
dikumpulkan mengikut pengecam sampel dalam baris pengepala @RG. Jika pengecam sampel adalah
tiada, setiap fail input dianggap sebagai satu sampel.

Dalam format timbunan (tanpa -uor-g), setiap baris mewakili kedudukan genomik,
terdiri daripada nama kromosom, koordinat, pangkalan rujukan, asas baca, baca
kualiti dan kualiti pemetaan penjajaran. Maklumat tentang padanan, ketidakpadanan,
indel, untaian, kualiti pemetaan dan permulaan dan akhir bacaan semuanya dikodkan di
lajur asas baca. Pada lajur ini, titik bermaksud padanan dengan rujukan
asas pada helai hadapan, koma untuk padanan pada helai terbalik, '>' atau
'<' untuk langkauan rujukan, `ACGTN' untuk ketidakpadanan pada untaian hadapan dan
`acgtn' untuk ketidakpadanan pada helai terbalik. Corak `\+[0-9]+[ACGTNacgtn]+'
menunjukkan terdapat sisipan antara kedudukan rujukan ini dan yang seterusnya
kedudukan rujukan. Panjang sisipan diberikan oleh integer dalam
corak, diikuti dengan urutan yang disisipkan. Begitu juga, corak
`-[0-9]+[ACGTNacgtn]+' mewakili pemadaman daripada rujukan. Yang dipadamkan
pangkalan akan dibentangkan sebagai `*' dalam baris berikut. Juga di pangkalan bacaan
lajur, simbol `^' menandakan permulaan bacaan. ASCII watak itu
berikutan `^' tolak 33 memberikan kualiti pemetaan. Simbol `$' menandakan berakhirnya
segmen yang dibaca.

Input Pilihan:

-6 Andaikan kualiti adalah dalam pengekodan Illumina 1.3+. -A Jangan ponteng
pasangan baca anomali dalam panggilan varian.

-B Lumpuhkan penjajaran semula kemungkinan untuk pengiraan asas
kualiti penjajaran (BAQ). BAQ ialah kebarangkalian berskala Phred untuk bacaan
asas tidak sejajar. Menggunakan pilihan ini sangat membantu untuk mengurangkan
SNP palsu yang disebabkan oleh salah jajaran.

-b FAIL Senarai fail BAM input, satu fail setiap baris [null]

-C INT Pekali untuk menurunkan kualiti pemetaan untuk bacaan yang mengandungi
ketidakpadanan yang berlebihan. Diberi bacaan dengan kebarangkalian berskala phred q
dijana daripada kedudukan dipetakan, kualiti pemetaan baharu
ialah tentang sqrt((INT-q)/INT)*INT. Nilai sifar melumpuhkan ini
kefungsian; jika didayakan, nilai yang disyorkan untuk BWA ialah 50. [0]

-d INT Pada kedudukan, baca secara maksimum INT bacaan setiap input BAM. [250]

-E Pengiraan BAQ lanjutan. Pilihan ini membantu sensitiviti terutamanya untuk
MNP, tetapi mungkin menjejaskan kekhususan sedikit.

-f FAIL . faidx-fail rujukan diindeks dalam format FASTA. Fail itu boleh
pilihan dimampatkan oleh razip. [null]

-l FAIL BED atau fail senarai kedudukan yang mengandungi senarai wilayah atau tapak di mana
pileup atau BCF harus dijana [null]

-q INT Kualiti pemetaan minimum untuk penjajaran yang akan digunakan [0]

-Q INT Kualiti asas minimum untuk asas yang perlu dipertimbangkan [13]

-r STR Hanya menjana timbunan di rantau ini STR [semua tapak]

Output Pilihan:

-D Output setiap sampel kedalaman bacaan

-g Kira kemungkinan genotip dan keluarkannya dalam format panggilan binari
(BCF).

-S Keluaran setiap sampel nilai P bias helai berskala Phred

-u Sama seperti -g kecuali bahawa output adalah BCF tidak dimampatkan, iaitu
lebih disukai untuk paip.

Pilihan Untuk Genotip Kemungkinan Pengiraan (Untuk -g or -u):

-e INT Kebarangkalian ralat penjujukan sambungan jurang berskala Phred. Mengurangkan INT
membawa kepada indel yang lebih panjang. [20]

-h INT Pekali untuk memodelkan ralat homopolimer. Diberi an l-panjang
larian homopolimer, ralat penjujukan bagi indel saiz s dimodelkan
as INT*s/l. [100]

-I Jangan lakukan panggilan INDEL

-L INT Langkau panggilan INDEL jika purata kedalaman setiap sampel adalah di atas INT.
[250]

-o INT Kebarangkalian ralat penjujukan terbuka jurang berskala Phred. Mengurangkan INT membawa
kepada lebih banyak panggilan indel. [40]

-p Gunakan ambang -m dan -F bagi setiap sampel untuk meningkatkan sensitiviti
memanggil. Secara lalai kedua-dua pilihan digunakan untuk bacaan yang dikumpulkan daripada semua
sampel.

-P STR Senarai platform yang dililitkan koma (ditentukan oleh @RG-PL) dari mana
calon indel diperolehi. Adalah disyorkan untuk mengumpul indel
calon daripada teknologi penjujukan yang mempunyai kadar ralat indel yang rendah
seperti ILLUMINA. [semua]

pengepala semula pengepala semula samtools

Gantikan pengepala masuk dalam.bam dengan tajuk masuk dalam.header.sam. Perintah ini ialah
lebih pantas daripada menggantikan pengepala dengan penukaran BAM->SAM->BAM.

kucing kucing samtools [-h header.sam] [-o out.bam] [ ... ]

Gabungkan BAM. Kamus jujukan setiap input BAM mestilah sama,
walaupun arahan ini tidak menyemak ini. Perintah ini menggunakan helah yang serupa dengan
pengepala semula yang membolehkan penggabungan BAM pantas.

jenis samtools sort [-nof] [-m maxMem]

Isih penjajaran mengikut koordinat paling kiri. Fail .bam akan dibuat.
Perintah ini juga boleh mencipta fail sementara .%d.bam apabila keseluruhan
penjajaran tidak boleh dipasang ke dalam memori (dikawal oleh pilihan -m).

PILIHAN:

-o Keluarkan penjajaran akhir kepada output standard.

-n Isih mengikut nama baca dan bukannya mengikut koordinat kromosom

-f Penggunaan sebagai laluan keluaran penuh dan jangan tambahkan .bam akhiran.

-m INT Lebih kurang memori maksimum yang diperlukan. [500000000]

bergabung samtools merge [-nur1f] [-h inh.sam] [-R reg]
[...]

Gabungkan berbilang penjajaran yang diisih. Rujukan pengepala menyenaraikan semua input
Fail BAM dan pengepala @SQ bagi inh.sam, jika ada, semua mesti merujuk kepada perkara yang sama
set urutan rujukan. Senarai rujukan pengepala dan (melainkan ditindih oleh
-h) `@' tajuk bagi in1.bam akan disalin ke keluar.bam, dan pengepala lain
fail akan diabaikan.

PILIHAN:

-1 Gunakan tahap mampatan zlib 1 untuk memampatkan output

-f Paksa untuk menulis ganti fail output jika ada.

-h FAIL Gunakan garisan daripada FAIL sebagai pengepala `@' untuk disalin ke keluar.bam, menggantikannya
mana-mana baris pengepala yang sebaliknya akan disalin daripada in1.bam. (FAIL is
sebenarnya dalam format SAM, walaupun sebarang rekod penjajaran yang mungkin terkandung di dalamnya adalah
tidak dihiraukan.)

-n Penjajaran input diisih mengikut nama baca dan bukannya mengikut kromosom
koordinat

-R STR Gabungkan fail dalam kawasan yang ditentukan yang ditunjukkan oleh STR [null]

-r Lampirkan tag RG pada setiap penjajaran. Nilai teg disimpulkan daripada fail
nama.

-u Keluaran BAM tidak dimampatkan

indeks indeks samtools

Penjajaran diisih indeks untuk akses rawak pantas. Fail indeks .bai akan
dicipta.

idxstats samtools idxstats

Dapatkan dan cetak statistik dalam fail indeks. Outputnya dihadkan dengan TAB
setiap baris yang terdiri daripada nama jujukan rujukan, panjang jujukan, # bacaan yang dipetakan
dan # bacaan tidak dipetakan.

faidx samtools faidx [wilayah1 [...]]

Jujukan rujukan indeks dalam format FASTA atau ekstrak jujukan daripada diindeks
urutan rujukan. Jika tiada wilayah dinyatakan, faidx akan mengindeks fail dan
mewujudkan .fai pada cakera. Jika kawasan ditentukan, susulannya
akan diambil dan dicetak ke stdout dalam format FASTA. Fail input boleh
dimampatkan dalam RAZF format.

fixmate samtools fixmate

Isikan koordinat pasangan, ISIZE dan bendera berkaitan pasangan daripada nama yang diisih
penjajaran.

rmdup samtools rmdup [-sS]

Alih keluar kemungkinan pendua PCR: jika pasangan bacaan berbilang mempunyai luaran yang sama
koordinat, hanya kekalkan pasangan dengan kualiti pemetaan tertinggi. Dalam pasangan-
mod tamat, arahan ini MESTI berfungsi dengan orientasi FR dan memerlukan ISIZE adalah
ditetapkan dengan betul. Ia tidak berfungsi untuk bacaan tidak berpasangan (cth. dua hujung dipetakan ke
kromosom yang berbeza atau bacaan anak yatim).

PILIHAN:

-s Alih keluar pendua untuk bacaan hujung tunggal. Secara lalai, arahan berfungsi untuk
bacaan hujung berpasangan sahaja.

-S Rawat bacaan hujung berpasangan dan bacaan hujung tunggal.

tenang samtools ditenangkan [-EeubSr] [-C capQcoef]

Hasilkan tag MD. Jika tag MD sudah ada, arahan ini akan memberikan a
amaran jika teg MD yang dihasilkan berbeza daripada teg sedia ada. Keluaran SAM
secara lalai.

PILIHAN:

-A Apabila digunakan bersama dengan -r pilihan ini menimpa pangkalan asal
berkualiti.

-e Tukarkan asas baca kepada = jika ia sama dengan rujukan sejajar
asas. Pemanggil Indel tidak menyokong pangkalan = pada masa ini.

-u Keluarkan BAM yang tidak dimampatkan

-b Keluaran BAM termampat

-S Input ialah SAM dengan baris pengepala

-C INT Pekali untuk mengehadkan kualiti pemetaan bacaan yang dipetakan dengan buruk. Lihat
terkumpul arahan untuk butiran. [0]

-r Kira teg BQ (tanpa -A) atau kualiti asas had dengan BAQ (dengan -A).

-E Pengiraan BAQ lanjutan. Pilihan ini memperdagangkan kekhususan untuk
sensitiviti, walaupun kesannya kecil.

targetcut samtools targetcut [-Q minBaseQ] [-i inPenalty] [-0 em0] [-1 em1] [-2 em2] [-f
rujuk]

Perintah ini mengenal pasti kawasan sasaran dengan memeriksa kesinambungan bacaan
kedalaman, mengira jujukan konsensus haploid sasaran dan mengeluarkan SAM dengan
setiap urutan sepadan dengan sasaran. Apabila pilihan -f sedang digunakan, BAQ akan
digunakan. Perintah ini ialah hanyalah direka untuk memotong klon fosmid daripada fosmid
penjujukan kolam [Ruj. Kitzman et al. (2010)].

fasa fasa samtools [-AF] [-k len] [-b awalan] [-q minLOD] [-Q minBaseQ]

SNP heterozigot panggilan dan fasa. PILIHAN:

-A Jatuhkan bacaan dengan fasa samar-samar.

-b STR Awalan keluaran BAM. Apabila pilihan ini digunakan, bacaan fasa-0 akan menjadi
disimpan dalam fail STR.0.bam dan fasa-1 dibaca masuk STR.1.bam. Fasa tidak diketahui
bacaan akan diperuntukkan secara rawak kepada salah satu daripada dua fail. Chimeric berbunyi
dengan ralat suis akan disimpan dalam STR.chimeric.bam. [null]

-F Jangan cuba betulkan bacaan chimeric.

-k INT Panjang maksimum untuk fasa tempatan. [13]

-q INT LOD berskala Phred minimum untuk memanggil heterozigot. [40]

-Q INT Kualiti asas minimum untuk digunakan dalam panggilan het. [13]

BCFTOOLS PERINTAH DAN PILIHAN


pandangan bcftools pandangan [-AbFGNQSucgv] [-D seqDict] [-l senaraiLoci] [-s listSample] [-i
jurangSNPratio] [-t mutRate] [-p varThres] [-m varThres] [-P sebelum] [-1 nKumpulan1]
[-d minFrac] [-U nPerm] [-X permThres] [-T trioType] dalam.bcf [rantau]

Tukar antara BCF dan VCF, panggil calon varian dan anggaran alel
kekerapan.

Input / Output Pilihan:

-A Kekalkan semua alel alternatif yang mungkin di tapak varian. Secara lalai,
arahan pandangan membuang alel yang tidak mungkin.

-b Output dalam format BCF. Lalai ialah VCF.

-D FAIL Kamus jujukan (senarai nama kromosom) untuk penukaran VCF->BCF
[null]

-F Nyatakan PL dijana oleh r921 atau sebelumnya (pesanan adalah berbeza).

-G Sekat semua maklumat genotip individu.

-l FAIL Senarai tapak di mana maklumat dikeluarkan [semua tapak]

-N Langkau tapak yang medan REF bukan A/C/G/T

-Q Keluarkan format kemungkinan QCALL

-s FAIL Senarai sampel untuk digunakan. Lajur pertama dalam input memberikan sampel
nama dan yang kedua memberikan ploidi, yang hanya boleh 1 atau 2. Apabila
lajur ke-2 tiada, ploidi sampel diandaikan 2. Dalam
output, susunan sampel akan sama dengan yang masuk FAIL.
[null]

-S Inputnya ialah VCF dan bukannya BCF.

-u Keluaran BCF tidak termampat (daya -b).

Konsensus/Varian Memanggil Pilihan:

-c Panggil varian menggunakan inferens Bayesian. Pilihan ini secara automatik
menyeru pilihan -e.

-d FLOAT Bila -v sedang digunakan, langkau lokus di mana pecahan sampel diliputi oleh
bacaan adalah di bawah FLOAT. [0]

-e Lakukan inferens kemungkinan maksimum sahaja, termasuk menganggarkan tapak
kekerapan alel, menguji keseimbangan dan ujian Hardy-Weinberg
persatuan dengan LRT.

-g Panggil genotip setiap sampel di tapak varian (force -c)

-i FLOAT Nisbah kadar mutasi INDEL-ke-SNP [0.15]

-m FLOAT Model baharu untuk panggilan multiallelik dan jarang-varian yang dipertingkatkan. Satu lagi
Alel ALT diterima jika P(chi^2) LRT melebihi ambang FLOAT.
Parameter kelihatan teguh dan nilai sebenar biasanya tidak
banyak mempengaruhi keputusan; nilai yang baik untuk digunakan ialah 0.99. Ini adalah
kaedah panggilan yang disyorkan. [0]

-p FLOAT Tapak dianggap sebagai variasi jika P(ref|D)

-P STR Spektrum frekuensi alel sebelum atau awal. Kalau STR boleh penuh, syarat2,
rata atau fail yang terdiri daripada output ralat daripada varian sebelumnya
memanggil lari.

-t FLOAT Kadar mutasi berskala untuk panggilan varian [0.001]

-T STR Dayakan panggilan pasangan/trio. Untuk panggilan trio, pilihan -s biasanya
perlu digunakan untuk mengkonfigurasi ahli trio dan pesanan mereka.
Dalam fail yang dibekalkan kepada pilihan -s, sampel pertama mestilah yang
anak, kedua bapa dan ketiga ibu. Yang sah
nilai-nilai STR ialah `pasangan', `trioauto', `trioxd' dan `triox', di mana
`pair' memanggil perbezaan antara dua sampel input, dan `trioxd'
(`trioxs') menyatakan bahawa input adalah daripada kromosom X bukan PAR
wilayah dan kanak-kanak itu adalah perempuan (lelaki). [null]

-v Tapak varian output sahaja (force -c)

Kontras Memanggil and Persatuan ujian Pilihan:

-1 INT Bilangan sampel kumpulan-1. Pilihan ini digunakan untuk membahagikan
sampel kepada dua kumpulan untuk panggilan kontras SNP atau ujian perkaitan.
Apabila pilihan ini digunakan, INFO VCF berikut akan dikeluarkan:
PC2, PCHI2 dan QCHI2. [0]

-U INT Bilangan pilih atur untuk ujian perkaitan (hanya berkesan dengan -1)
[0]

-X FLOAT Hanya lakukan pilih atur untuk P(chi^2) -U)
[0.01]

indeks bcftools indeks dalam.bcf

Indeks diisih BCF untuk akses rawak.

kucing bcftools kucing dalam1.bcf [dalam2.bcf [...]]]

Gabungkan fail BCF. Fail input perlu diisih dan mempunyai
sampel yang sama muncul dalam susunan yang sama.

SAM FORMAT


Format Penjajaran Jujukan/Peta (SAM) adalah dibataskan TAB. Selain daripada baris pengepala, yang
dimulakan dengan simbol `@', setiap baris penjajaran terdiri daripada:

┌────┬───────┬──────────────────────────────────── ──────────────────────┐
ColBidangPenerangan Produk
├────┼───────┼──────────────────────────────────── ──────────────────────┤
│ 1 │ QNAME │ Templat pertanyaan/pasangan NAMA │
│ 2 │ BENDERA │ BENDERA bitwise │
│ 3 │ RNAME │ Urutan rujukan NAME │
│ 4 │ POS │ Kedudukan paling kiri berasaskan 1/koordinat urutan terpotong │
│ 5 │ MAPQ │ Kualiti Pemetaan (berskala Phred) │
│ 6 │ CIAGR │ rentetan CIGAR dilanjutkan │
│ 7 │ MRNM │ Urutan Rujukan Pasangan NaMe (`=' jika sama dengan RNAME) │
│ 8 │ MPOS │ POSistion Mate 1 berasaskan │
│ 9 │ TLEN │ disimpulkan PANJANG Templat (saiz sisipan) │
│10 │ SEQ │ pertanyaan URUTAN pada helai yang sama dengan rujukan │
│11 │ KUAL │ pertanyaan KUALITI (ASCII-33 memberikan kualiti asas Phred) │
│12+ │ OPT │ medan PILIHAN berubah dalam format TAG:VTYPE:VALUE │
└────┴───────┴──────────────────────────────────── ──────────────────────┘

Setiap bit dalam medan FLAG ditakrifkan sebagai:

┌───────┬─────┬─────────────────────────────────── ───────────────┐
BenderaBCPenerangan Produk
├───────┼─────┼─────────────────────────────────── ───────────────┤
│0x0001 │ p │ bacaan dipasangkan dalam urutan │
│0x0002 │ P │ bacaan dipetakan dalam pasangan yang betul │
│0x0004 │ u │ urutan pertanyaan itu sendiri tidak dipetakan │
│0x0008 │ U │ pasangan tidak dipetakan │
│0x0010 │ r │ untaian pertanyaan (1 untuk terbalik) │
│0x0020 │ R │ helai pasangan │
│0x0040 │ 1 │ bacaan adalah bacaan pertama dalam sepasang │
│0x0080 │ 2 │ bacaan adalah bacaan kedua dalam sepasang │
│0x0100 │ s │ penjajaran bukan utama │
│0x0200 │ f │ platform baca gagal/semakan kualiti vendor │
│0x0400 │ d │ bacaan adalah sama ada PCR atau pendua optik │
└───────┴─────┴─────────────────────────────────── ───────────────┘
di mana lajur kedua memberikan perwakilan rentetan medan FLAG.

VCF FORMAT


Format Panggilan Varian (VCF) ialah format yang dibataskan TAB dengan setiap baris data terdiri daripada
medan berikut:

┌────┬────────┬─────────────────────────────────── ───────────────────────────┐
ColBidangPenerangan Produk
├────┼────────┼─────────────────────────────────── ───────────────────────────┤
│ 1 │ CHROM │ Nama CHROMosom │
│ 2 │ POS │ POSISI paling kiri bagi varian │
│ 3 │ ID │ pengecam varian unik │
│ 4 │ REF │ alel Rujukan │
│ 5 │ ALT │ alel Alternate, dipisahkan dengan koma │
│ 6 │ KUALITI │ varian/rujukan KUALITI │
│ 7 │ PENAPIS │ PENAPIS digunakan │
│ 8 │ INFO │ MAKLUMAT yang berkaitan dengan varian, dipisahkan dengan koma bertindih │
│ 9 │ FORMAT │ FORMAT medan genotip, dipisahkan oleh kolon (pilihan) │
│10+ │ SAMPEL │ SAMPEL genotip dan maklumat setiap sampel (pilihan) │
└────┴────────┴─────────────────────────────────── ───────────────────────────┘

Jadual berikut memberikan INFO tag yang digunakan oleh samtools dan bcftools.

┌──────┬───────────┬────────────────────────────── ────────────────────────────────────────────────── ────────────────────┐
TagformatPenerangan Produk
├──────┼───────────┼────────────────────────────── ────────────────────────────────────────────────── ────────────────────┤
└──────┴───────────┴────────────────────────────── ────────────────────────────────────────────────── ────────────────────┘

CONTOH


o Import SAM ke BAM apabila @SQ baris terdapat dalam tajuk:

paparan samtools -bS aln.sam > aln.bam

If @SQ baris tiada:

samtools faidx ref.fa
samtools view -bt ref.fa.fai aln.sam > aln.bam

di mana ref.fa.fai dijana secara automatik oleh faidx perintah.

o Lampirkan RG tag semasa menggabungkan penjajaran diisih:

perl -e 'cetak
"@RG\tID:ga\tSM:hs\tLB:ga\tPL:Illumina\n@RG\tID:454\tSM:hs\tLB:454\tPL:454\n"' > rg.txt
samtools merge -rh rg.txt merged.bam ga.bam 454.bam

Nilai dalam a RG tag ditentukan oleh nama fail asal bacaan itu. Di dalam ini
contoh, dalam digabungkan.bam, dibaca dari ga.bam akan dilampirkan RG:Z:ga, sambil dibaca dari
454.bam akan dilampirkan RG:Z:454.

o Panggil SNP dan INDEL pendek untuk satu individu diploid:

samtools mpileup -ugf ref.fa aln.bam | paparan bcftools -bvcg - > var.raw.bcf
bcftools lihat var.raw.bcf | vcfutils.pl varFilter -D 100 > var.flt.vcf

. -D pilihan varFilter mengawal kedalaman bacaan maksimum, yang harus dilaraskan kepada
kira-kira dua kali ganda purata kedalaman bacaan. Seseorang boleh mempertimbangkan untuk menambah -C50 kepada mpileup jika pemetaan
kualiti dianggarkan terlalu tinggi untuk bacaan yang mengandungi ketidakpadanan yang berlebihan. Menggunakan pilihan ini
biasanya membantu BWA-pendek tetapi mungkin tidak pemeta lain.

o Hasilkan urutan konsensus untuk satu individu diploid:

samtools mpileup -uf ref.fa aln.bam | bcftools view -cg - | vcfutils.pl vcf2fq >
cns.fq

o Panggil mutasi somatik daripada sepasang sampel:

samtools mpileup -DSuf ref.fa aln.bam | bcftools view -bvcgT pair - > var.bcf

Dalam medan INFO keluaran, CLR memberikan nisbah Phred-log antara kemungkinan dengan
merawat kedua-dua sampel secara bebas, dan kemungkinan dengan memerlukan genotip untuk
menjadi serupa. ini CLR secara berkesan adalah skor yang mengukur keyakinan somatik
panggilan. Lagi tinggi lagi bagus.

o Panggil de novo dan mutasi somatik daripada trio keluarga:

samtools mpileup -DSuf ref.fa aln.bam | bcftools view -bvcgT pair -s samples.txt - >
var.bcf

File samples.txt hendaklah terdiri daripada tiga baris yang menyatakan ahli dan susunan
sampel (dalam susunan anak-bapa-ibu). Begitu juga, CLR memberikan Phred-log
nisbah kemungkinan dengan dan tanpa kekangan trio. CGU menunjukkan yang paling mungkin
konfigurasi genotip tanpa kekangan trio, dan CGT memberikan yang paling mungkin
konfigurasi genotip memenuhi kekangan trio.

o Fasa satu individu:

samtools calmd -AEur aln.bam ref.fa | samtools fasa -b awalan -> fasa.keluar

. tenang arahan digunakan untuk mengurangkan heterozigot palsu di sekeliling INDEL.

o Panggil SNP dan indel pendek untuk berbilang individu diploid:

samtools mpileup -P ILLUMINA -ugf ref.fa *.bam | bcftools view -bcvg - > var.raw.bcf
bcftools lihat var.raw.bcf | vcfutils.pl varFilter -D 2000 > var.flt.vcf

Individu dikenal pasti daripada SM tag dalam @RG baris pengepala. Individu boleh
dikumpulkan dalam satu fail penjajaran; satu individu juga boleh diasingkan kepada berbilang fail.
. -P pilihan menentukan bahawa calon indel harus dikumpulkan hanya daripada kumpulan baca
dengan @RG-PL tag ditetapkan kepada ILLUMINA. Mengumpul calon indel daripada bacaan berurutan
oleh teknologi rawan indel boleh menjejaskan prestasi panggilan indel.

Ambil perhatian bahawa terdapat model panggilan baharu yang boleh digunakan oleh

paparan bcftools -m0.99 ...

yang membetulkan beberapa had teruk kaedah lalai.

Untuk penapisan, hasil terbaik nampaknya dicapai dengan terlebih dahulu menggunakan SnpGap tapisan dan
kemudian menggunakan beberapa pendekatan pembelajaran mesin

vcf-anotasi -f SnpGap=n
penapis vcf...

Kedua-duanya boleh didapati di vcftools and htslib pakej (pautan di bawah).

o Dapatkan spektrum kekerapan alel (AFS) pada senarai tapak daripada berbilang individu:

samtools mpileup -Igf ref.fa *.bam > all.bcf
bcftools view -bl sites.list all.bcf > sites.bcf
bcftools view -cGP cond2 sites.bcf > /dev/null 2> sites.1.afs
bcftools view -cGP sites.1.afs sites.bcf > /dev/null 2> sites.2.afs
bcftools view -cGP sites.2.afs sites.bcf > /dev/null 2> sites.3.afs
......

di mana sites.list mengandungi senarai tapak dengan setiap baris terdiri daripada rujukan
nama urutan dan kedudukan. Yang berikut bcftools arahan menganggarkan AFS oleh EM.

o Buang penjajaran terpakai BAQ untuk pemanggil SNP lain:

samtools calmd -bAr aln.bam > aln.baq.bam

Ia menambah dan membetulkan NM and MD tag pada masa yang sama. The tenang perintah juga datang
dengan -C pilihan, sama seperti dalam terkumpul and mpileup. Mohon jika ia membantu.

HADAH


o Perkataan tidak sejajar yang digunakan dalam bam_import.c, bam_endian.h, bam.c dan bam_aux.c.

o Samtools paired-end rmdup tidak berfungsi untuk bacaan tidak berpasangan (cth yatim membaca atau tamat
dipetakan kepada kromosom yang berbeza). Jika ini membimbangkan, sila gunakan Picard's
MarkDuplicate yang mengendalikan kes ini dengan betul, walaupun sedikit perlahan.

Gunakan bcftools dalam talian menggunakan perkhidmatan onworks.net


Pelayan & Stesen Kerja Percuma

Muat turun apl Windows & Linux

  • 1
    Firebird
    Firebird
    Firebird RDBMS menawarkan ciri ANSI SQL
    & berjalan pada Linux, Windows &
    beberapa platform Unix. ciri-ciri
    konkurensi & prestasi cemerlang
    & kuasa...
    Muat turun Firebird
  • 2
    KompoZer
    KompoZer
    KompoZer ialah editor HTML wysiwyg menggunakan
    pangkalan kod Mozilla Composer. Sebagai
    Pembangunan Nvu telah dihentikan
    pada tahun 2005, KompoZer membetulkan banyak pepijat dan
    menambah f...
    Muat turun KompoZer
  • 3
    Muat turun Manga Percuma
    Muat turun Manga Percuma
    The Free Manga Downloader (FMD) ialah sebuah
    aplikasi sumber terbuka yang ditulis dalam
    Objek-Pascal untuk mengurus dan
    memuat turun manga dari pelbagai laman web.
    Ini adalah cermin...
    Muat turun Manga Downloader Percuma
  • 4
    Aetbootin
    Aetbootin
    UNetbootin membolehkan anda mencipta boleh boot
    Pemacu USB langsung untuk Ubuntu, Fedora dan
    pengedaran Linux lain tanpa
    membakar CD. Ia berjalan pada Windows, Linux,
    dan ...
    Muat turun UNetbootin
  • 5
    Dolibar ERP - CRM
    Dolibar ERP - CRM
    Dolibarr ERP - CRM adalah mudah untuk digunakan
    Pakej perisian sumber terbuka ERP dan CRM
    (jalankan dengan pelayan php web atau sebagai
    perisian kendiri) untuk perniagaan,
    asas...
    Muat turun Dolibar ERP - CRM
  • 6
    Pelanggan SQL SQuirreL
    Pelanggan SQL SQuirreL
    SQuirreL SQL Client ialah SQL grafik
    klien yang ditulis dalam Java yang akan membolehkan
    anda untuk melihat struktur JDBC
    pangkalan data yang mematuhi, semak imbas data dalam
    meja...
    Muat turun SQuirreL SQL Client
  • Lebih »

Arahan Linux

Ad