InggrisPerancisSpanyol

Ad


favorit OnWorks

bcftools - Online di Cloud

Jalankan bcftools di penyedia hosting gratis OnWorks melalui Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

Ini adalah perintah bcftools yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

PROGRAM:

NAMA


samtools - Utilitas untuk format Sequence Alignment/Map (SAM)

bcftools - Utilitas untuk Format Panggilan Biner (BCF) dan VCF

RINGKASAN


tampilan samtools -bt ref_list.txt -o aln.bam aln.sam.gz

samtools mengurutkan aln.bam aln.diurutkan

indeks samtools aln.sorted.bam

samtools idxstats aln.sorted.bam

samtools melihat aln.sorted.bam chr2:20,100,000-20,200,000

samtools menggabungkan out.bam in1.bam in2.bam in3.bam

samtools faidx ref.fasta

samtools tumpukan -vcf ref.fasta aln.sorted.bam

samtools mpileup -C50 -gf ref.fasta -r chr3:1,000-2,000 in1.bam in2.bam

samtools tview aln.sorted.bam ref.fasta

indeks bcftools di.bcf

bcftools lihat in.bcf chr2:100-200 > out.vcf

tampilan bcftools -Nvm0.99 in.bcf > out.vcf 2> out.afs

DESKRIPSI


Samtools adalah seperangkat utilitas yang memanipulasi keberpihakan dalam format BAM. Itu mengimpor
dari dan mengekspor ke format SAM (Sequence Alignment/Map), melakukan pengurutan, penggabungan, dan
pengindeksan, dan memungkinkan untuk mengambil bacaan di wilayah mana pun dengan cepat.

Samtools dirancang untuk bekerja pada aliran. Ini menganggap file input `-' sebagai standar
input (stdin) dan file output `-' sebagai output standar (stdout). Beberapa perintah dapat
sehingga digabungkan dengan pipa Unix. Samtools selalu menampilkan pesan peringatan dan kesalahan ke
keluaran kesalahan standar (stderr).

Samtools juga dapat membuka file BAM (bukan SAM) di server FTP atau HTTP jarak jauh jika:
Nama file BAM dimulai dengan `ftp://' atau `http://'. Samtools memeriksa kerja saat ini
direktori untuk file indeks dan akan mengunduh indeks jika tidak ada. Samtools tidak
mengambil seluruh file penyelarasan kecuali jika diminta untuk melakukannya.

SAMTOOL PERINTAH DAN PILIHAN


melihat tampilan samtools [-bchuHS] [-t in.refList] [-o output] [-f reqFlag] [-F skipFlag]
[-q minMapQ] [-l perpustakaan] [-r readGroup] [-R rgFile] | [wilayah1
[...]

Ekstrak/cetak semua atau sub keberpihakan dalam format SAM atau BAM. Jika tidak ada wilayah
ditentukan, semua penjajaran akan dicetak; jika tidak hanya keberpihakan
tumpang tindih wilayah yang ditentukan akan menjadi output. Sebuah keselarasan dapat diberikan
beberapa kali jika tumpang tindih beberapa daerah. Suatu wilayah dapat disajikan,
misalnya, dalam format berikut: `chr2' (seluruh chr2), `chr2:1000000'
(wilayah mulai dari 1,000,000bp) atau `chr2:1,000,000-2,000,000' (wilayah antara
1,000,000 dan 2,000,000bp termasuk titik akhir). Koordinatnya berbasis 1.

PILIHAN:

-b Keluaran dalam format BAM.

-f INT Hanya penyelarasan keluaran dengan semua bit dalam INT yang ada di bidang FLAG.
INT bisa dalam bentuk hex dalam format /^0x[0-9A-F]+/ [0]

-F INT Lewati perataan dengan bit yang ada di INT [0]

-h Sertakan header dalam output.

-H Keluarkan header saja.

-l STR Hanya keluaran yang dibaca di perpustakaan STR [null]

-o FILE Berkas keluaran [stdout]

-q INT Lewati perataan dengan MAPQ lebih kecil dari INT [0]

-r STR Hanya keluaran yang dibaca di grup baca STR [null]

-R FILE Output dibaca dalam grup baca yang tercantum di FILE [batal]

-s FLOAT Pecahan template/pasangan ke subsampel; bagian bilangan bulat diperlakukan
sebagai benih untuk pembangkit bilangan acak [-1]

-S Masukan ada di SAM. Jika baris header @SQ tidak ada, `-t' pilihannya adalah
diperlukan.

-c Alih-alih mencetak penjajaran, hitung saja dan cetak
jumlah total. Semua opsi filter, seperti `-f', `-F' dan `-q' , Adalah
diperhitungkan.

-t FILE File ini dibatasi TAB. Setiap baris harus berisi nama referensi
dan panjang referensi, satu baris untuk setiap referensi yang berbeda;
bidang tambahan diabaikan. File ini juga mendefinisikan urutan
urutan referensi dalam penyortiran. Jika Anda menjalankan `samtools faidx ',
file indeks yang dihasilkan .fai bisa digunakan seperti ini
file.

-u Keluarkan BAM yang tidak terkompresi. Opsi ini menghemat waktu yang dihabiskan untuk
kompresi/dekompresi dan dengan demikian lebih disukai ketika outputnya
disalurkan ke perintah samtools lain.

tvview tayangan samtools [-p chr: pos] [-s STR] [-d pameran] [ref.fasta]

Penampil perataan teks (berdasarkan pustaka ncurses). Di penampil, tekan `?'
untuk bantuan dan tekan `g' untuk memeriksa perataan mulai dari wilayah dalam format
seperti `chr10:10,000,000' atau `=10,000,000' saat melihat referensi yang sama
urutan.

Pilihan:

-d pameran Keluarkan sebagai (H)tml atau (C)urses atau (T)ext

-p chr: pos Langsung ke posisi ini

-s STR Tampilkan hanya bacaan dari sampel ini atau grup baca

mpileup mpileup samtools [-EBugp] [-C capQcoef] [-r reg] [-f di.fa] [-l daftar] [-M
capPetaQ] [-Q minBaseQ] [-q minPetaQ] di.bam [di2.bam [...]]

Hasilkan BCF atau pileup untuk satu atau beberapa file BAM. Catatan keselarasan adalah
dikelompokkan berdasarkan pengidentifikasi sampel di baris header @RG. Jika pengidentifikasi sampel adalah
tidak ada, setiap file input dianggap sebagai satu sampel.

Dalam format pileup (tanpa -uor-g), setiap baris mewakili posisi genom,
terdiri dari nama kromosom, koordinat, basis referensi, basis baca, baca
kualitas dan kualitas pemetaan keselarasan. Informasi tentang kecocokan, ketidakcocokan,
indel, untai, kualitas pemetaan dan awal dan akhir pembacaan semuanya dikodekan di
kolom dasar baca. Di kolom ini, sebuah titik menunjukkan kecocokan dengan referensi
berdasarkan untaian depan, koma untuk kecocokan pada untaian terbalik, '>' atau
'<' untuk lompatan referensi, `ACGTN' untuk ketidakcocokan pada untaian maju dan
`acgtn' untuk ketidakcocokan pada untaian terbalik. Pola `\+[0-9]+[ACGTNacgtn]+'
menunjukkan ada penyisipan antara posisi referensi ini dan berikutnya
posisi referensi. Panjang penyisipan diberikan oleh bilangan bulat dalam
pola, diikuti dengan urutan yang disisipkan. Demikian pula, pola
`-[0-9]+[ACGTNacgtn]+' mewakili penghapusan dari referensi. Yang dihapus
basis akan disajikan sebagai `*' pada baris berikut. Juga di pangkalan baca
kolom, simbol `^' menandai awal pembacaan. ASCII dari karakter
berikut `^' minus 33 memberikan kualitas pemetaan. Simbol `$' menandai akhir dari
segmen baca.

Memasukkan Pilihan:

-6 Asumsikan kualitasnya dalam pengkodean Illumina 1.3+. -A Jangan lewati
pasangan baca anomali dalam panggilan varian.

-B Nonaktifkan penataan kembali probabilistik untuk perhitungan basis
kualitas keselarasan (BAQ). BAQ adalah probabilitas pembacaan skala Phred
dasar menjadi tidak sejajar. Menerapkan opsi ini sangat membantu mengurangi
SNP palsu yang disebabkan oleh misalignment.

-b FILE Daftar file BAM input, satu file per baris [null]

-C INT Koefisien untuk menurunkan kualitas pemetaan untuk bacaan yang mengandung
ketidaksesuaian yang berlebihan. Diberikan pembacaan dengan probabilitas skala phred q
dihasilkan dari posisi yang dipetakan, kualitas pemetaan baru
adalah tentang sqrt((INT-q)/INT)*INT. Nilai nol menonaktifkan ini
Kegunaan; jika diaktifkan, nilai yang disarankan untuk BWA adalah 50. [0]

-d INT Pada suatu posisi, bacalah secara maksimal INT membaca per masukan BAM. [250]

-E Perhitungan BAQ yang diperluas. Opsi ini membantu sensitivitas terutama untuk
MNP, tetapi mungkin sedikit mengganggu spesifisitas.

-f FILE Grafik faidx-file referensi terindeks dalam format FASTA. Filenya bisa
opsional dikompresi oleh razip. [batal]

-l FILE BED atau file daftar posisi yang berisi daftar wilayah atau situs tempat
pileup atau BCF harus dibuat [null]

-q INT Kualitas pemetaan minimum untuk penyelarasan yang akan digunakan [0]

-Q INT Kualitas dasar minimum untuk bahan dasar yang harus dipertimbangkan [13]

-r STR Hanya menghasilkan pileup di wilayah STR [semua situs]

Keluaran Pilihan:

-D Output kedalaman baca per sampel

-g Hitung kemungkinan genotipe dan keluarkan dalam format panggilan biner
(BCF).

-S Output per sampel Nilai-P bias untai skala Phred

-u Mirip dengan -g kecuali bahwa outputnya adalah BCF yang tidak terkompresi, yaitu
disukai untuk perpipaan.

Opsi untuk Genotip Kemungkinan Komputasi (Untuk -g or -u):

-e INT Probabilitas kesalahan pengurutan ekstensi celah skala-phred. Mengurangi INT
mengarah ke indel yang lebih panjang. [20]

-h INT Koefisien untuk memodelkan kesalahan homopolimer. Diberikan sebuah l-panjang
menjalankan homopolimer, kesalahan pengurutan ukuran indel s dimodelkan
as INT*s/l. [100]

-I Jangan lakukan panggilan INDEL

-L INT Lewati panggilan INDEL jika kedalaman rata-rata per sampel di atas INT.
[250]

-o INT Probabilitas kesalahan pengurutan terbuka celah skala-phred. Mengurangi INT mengarah
untuk lebih banyak panggilan indel. [40]

-p Terapkan ambang batas -m dan -F per sampel untuk meningkatkan sensitivitas
panggilan. Secara default, kedua opsi diterapkan untuk membaca yang dikumpulkan dari semua
sampel.

-P STR Daftar platform yang dibatasi koma (ditentukan oleh @RG-PL) dari mana
kandidat indel diperoleh. Disarankan untuk mengumpulkan indel
kandidat dari teknologi pengurutan yang memiliki tingkat kesalahan indel rendah
seperti ILUMINA. [semua]

judul ulang samtools reheader

Ganti header di di.bam dengan header di di.header.sam. Perintah ini adalah
jauh lebih cepat daripada mengganti header dengan konversi BAM->SAM->BAM.

kucing samtools cat [-h header.sam] [-o out.bam] [ ... ]

Menggabungkan BAM. Kamus urutan setiap input BAM harus identik,
meskipun perintah ini tidak memeriksa ini. Perintah ini menggunakan trik yang mirip dengan
judul ulang yang memungkinkan penggabungan BAM cepat.

jenis samtools sort [-nof] [-m maxMem]

Urutkan perataan berdasarkan koordinat paling kiri. Mengajukan .bam akan dibuat.
Perintah ini juga dapat membuat file sementara .%d.bam ketika keseluruhan
keselarasan tidak dapat dipasang ke memori (dikendalikan oleh opsi -m).

PILIHAN:

-o Keluarkan penyelarasan akhir ke keluaran standar.

-n Urutkan berdasarkan nama yang dibaca daripada berdasarkan koordinat kromosom

-f penggunaan sebagai jalur keluaran lengkap dan jangan tambahkan .bam akhiran.

-m INT Kira-kira memori maksimum yang dibutuhkan. [500000000]

bergabung samtools menggabungkan [-nur1f] [-h inh.sam] [-R reg]
[...]

Gabungkan beberapa perataan yang diurutkan. Daftar referensi tajuk dari semua input
file BAM, dan header @SQ dari inh.sam, jika ada, semua harus mengacu pada yang sama
kumpulan urutan referensi. Daftar referensi tajuk dan (kecuali diganti oleh
-h) `@' header dari di1.bam akan disalin ke keluar.bam, dan tajuk lainnya
file akan diabaikan.

PILIHAN:

-1 Gunakan kompresi zlib level 1 untuk mengompresi output

-f Paksa untuk menimpa file output jika ada.

-h FILE Gunakan garis FILE sebagai header `@' yang akan disalin ke keluar.bam, mengganti
setiap baris tajuk yang seharusnya disalin dari di1.bam. (FILE is
sebenarnya dalam format SAM, meskipun catatan penyelarasan apa pun yang mungkin ada di dalamnya adalah
diabaikan.)

-n Penjajaran input diurutkan berdasarkan nama yang dibaca daripada berdasarkan kromosom
koordinat

-R STR Gabungkan file di wilayah tertentu yang ditunjukkan oleh STR [batal]

-r Lampirkan tag RG ke setiap perataan. Nilai tag disimpulkan dari file
nama.

-u Output BAM tidak terkompresi

indeks indeks samtools

Perataan yang diurutkan indeks untuk akses acak cepat. File indeks .bai akan
dibuat.

idxstats samtools idxstats

Ambil dan cetak statistik dalam file indeks. Outputnya adalah TAB yang dibatasi dengan
setiap baris terdiri dari nama urutan referensi, panjang urutan, # bacaan yang dipetakan
dan # bacaan yang belum dipetakan.

faidx samtools faidx [wilayah1 [...]]

Urutan referensi indeks dalam format FASTA atau ekstrak urutan dari yang diindeks
urutan referensi. Jika tidak ada wilayah yang ditentukan, faidx akan mengindeks file dan
membuat .fai pada disk. Jika daerah ditentukan, urutannya
akan diambil dan dicetak ke stdout dalam format FASTA. File masukan dapat
dikompresi di RAZF Format.

teman tetap samtools fixmate

Isi koordinat pasangan, ISIZE dan bendera terkait pasangan dari yang diurutkan nama
penjajaran.

rmdup samtools rmdup [-sS]

Hapus duplikat PCR potensial: jika beberapa pasangan baca memiliki eksternal yang identik
koordinat, hanya pertahankan pasangan dengan kualitas pemetaan tertinggi. Dalam berpasangan-
mode akhir, perintah ini HANYA bekerja dengan orientasi FR dan membutuhkan ISIZE adalah
diatur dengan benar. Ini tidak berfungsi untuk pembacaan yang tidak berpasangan (misalnya dua ujung dipetakan ke
kromosom yang berbeda atau bacaan yatim).

PILIHAN:

-s Hapus duplikat untuk pembacaan satu ujung. Secara default, perintah berfungsi untuk
hanya membaca akhir berpasangan.

-S Perlakukan pembacaan berpasangan dan pembacaan ujung tunggal.

tenang samtools tenang [-EeubSr] [-C capQcoef]

Buat tag MD. Jika tag MD sudah ada, perintah ini akan memberikan
peringatan jika tag MD yang dihasilkan berbeda dengan tag yang ada. Keluaran SAM
secara default

PILIHAN:

-A Ketika digunakan bersama dengan -r opsi ini menimpa basis asli
kualitas.

-e Ubah basis baca menjadi = jika identik dengan referensi sejajar
basis. Penelepon Indel tidak mendukung basis = saat ini.

-u Keluaran BAM tidak terkompresi

-b Keluaran BAM terkompresi

-S Inputnya adalah SAM dengan garis header

-C INT Koefisien untuk membatasi kualitas pemetaan bacaan yang dipetakan dengan buruk. Lihat
menumpuk perintah untuk rincian. [0]

-r Hitung tag BQ (tanpa -A) atau cap base quality dengan BAQ (dengan -A).

-E Perhitungan BAQ yang diperluas. Opsi ini memperdagangkan kekhususan untuk
sensitivitas, meskipun efeknya kecil.

potongan target pemotongan target samtools [-Q minBaseQ] [-i dalam Penalti] [-0 em0] [-1 em1] [-2 em2] [-f
ref]

Perintah ini mengidentifikasi wilayah target dengan memeriksa kontinuitas pembacaan
kedalaman, menghitung urutan konsensus haploid dari target dan mengeluarkan SAM dengan
setiap urutan yang sesuai dengan target. Pilihan kapan -f sedang digunakan, BAQ akan menjadi
terapan. Perintah ini adalah hanya dirancang untuk memotong klon fosmid dari fosmid
pengurutan kolam [Ref. Kitzman dkk. (2010)].

tahap fase samtools [-AF] [-k len] [-b awalan] [-q minLOD] [-Q minBaseQ]

Panggilan dan fase SNP heterozigot. PILIHAN:

-A Jatuhkan bacaan dengan fase ambigu.

-b STR Awalan keluaran BAM. Saat opsi ini digunakan, pembacaan fase-0 akan menjadi
disimpan dalam file STR.0.bam dan fase-1 membaca STR.1.bam. Fase tidak diketahui
membaca akan dialokasikan secara acak ke salah satu dari dua file. Bacaan chimeric
dengan kesalahan sakelar akan disimpan di STR.chimeric.bam. [batal]

-F Jangan mencoba memperbaiki pembacaan chimeric.

-k INT Panjang maksimum untuk pentahapan lokal. [13]

-q INT LOD skala Phred minimum untuk memanggil heterozigot. [40]

-Q INT Kualitas dasar minimum untuk digunakan dalam panggilan panas. [13]

BCFTTOOLS PERINTAH DAN PILIHAN


melihat com.bcftools melihat [-AbFGNQSucgv] [-D seqDict] [-l daftarLoci] [-s daftarContoh] [-i
kesenjanganSNPrasio] [-t mutRate] [-p varThres] [-m varThres] [-P sebelumnya] [-1 nGrup1]
[-d minFrac] [-U nPerm] [-X permThres] [-T trioTip] di.bcf [wilayah]

Konversi antara BCF dan VCF, panggil kandidat varian dan perkirakan alel
frekuensi.

Input / Output Pilihan:

-A Pertahankan semua kemungkinan alel alternatif di situs varian. Secara default,
perintah view membuang alel yang tidak mungkin.

-b Keluaran dalam format BCF. Standarnya adalah VCF.

-D FILE Kamus urutan (daftar nama kromosom) untuk konversi VCF->BCF
[batal]

-F Tunjukkan PL dihasilkan oleh r921 atau sebelumnya (pemesanan berbeda).

-G Menekan semua informasi genotipe individu.

-l FILE Daftar situs tempat informasi dikeluarkan [semua situs]

-N Lewati situs di mana bidang REF bukan A/C/G/T

-Q Keluarkan format kemungkinan QCALL

-s FILE Daftar sampel yang akan digunakan. Kolom pertama di input memberikan sampel
nama dan yang kedua memberikan ploidi, yang hanya bisa 1 atau 2. Ketika
kolom ke-2 tidak ada, ploidi sampel diasumsikan 2. Dalam
output, pemesanan sampel akan identik dengan yang ada di FILE.
[batal]

-S Inputnya adalah VCF bukan BCF.

-u Output BCF tidak terkompresi (force -b).

Konsensus/Varian panggilan Pilihan:

-c Panggil varian menggunakan inferensi Bayesian. Opsi ini secara otomatis
memanggil opsi -e.

-d FLOAT Ketika -v sedang digunakan, lewati lokus di mana fraksi sampel tercakup oleh
membaca di bawah FLOAT. [0]

-e Lakukan inferensi kemungkinan maksimal saja, termasuk memperkirakan situs
frekuensi alel, pengujian keseimbangan dan pengujian Hardy-Weinberg
asosiasi dengan LRT.

-g Panggil genotipe per sampel di situs varian (force -c)

-i FLOAT Rasio tingkat mutasi INDEL-ke-SNP [0.15]

-m FLOAT Model baru untuk panggilan multialel dan varian langka yang lebih baik. Lain
Alel ALT diterima jika P(chi^2) LRT melebihi ambang batas FLOAT.
Parameternya tampak kuat dan nilai sebenarnya biasanya tidak
mempengaruhi hasil banyak; nilai yang baik untuk digunakan adalah 0.99. Ini adalah
metode panggilan yang direkomendasikan. [0]

-p FLOAT Sebuah situs dianggap varian jika P(ref|D)

-P STR Spektrum frekuensi alel sebelumnya atau awal. Jika STR bisa penuh, kondisi2,
datar atau file yang terdiri dari keluaran kesalahan dari varian sebelumnya
memanggil lari.

-t FLOAT Tingkat mutasi yang diskalakan untuk panggilan varian [0.001]

-T STR Aktifkan panggilan pasangan/trio. Untuk panggilan trio, opsi -s biasanya
perlu diterapkan untuk mengkonfigurasi anggota trio dan pemesanan mereka.
Dalam file yang disediakan untuk opsi -s, sampel pertama harus
anak, yang kedua ayah dan yang ketiga ibu. yang valid
nilai dari STR adalah `pair', `trioauto', `trioxd' dan `trioxs', di mana
`pair' memanggil perbedaan antara dua sampel input, dan `trioxd'
(`trioxs') menentukan bahwa input berasal dari kromosom X non-PAR
daerah dan anaknya berjenis kelamin perempuan (laki-laki). [batal]

-v Hanya situs varian keluaran (force -c)

Kontras panggilan dan Asosiasi uji Pilihan:

-1 INT Jumlah sampel kelompok-1. Opsi ini digunakan untuk membagi
sampel menjadi dua kelompok untuk panggilan SNP kontras atau uji asosiasi.
Saat opsi ini digunakan, INFO VCF berikut akan dikeluarkan:
PC2, PCHI2 dan QCHI2. [0]

-U INT Jumlah permutasi untuk uji asosiasi (hanya efektif dengan -1)
[0]

-X FLOAT Hanya lakukan permutasi untuk P(chi^2) -U)
[0.01]

indeks com.bcftools indeks di.bcf

Indeks BCF yang diurutkan untuk akses acak.

kucing com.bcftools kucing dalam1.bcf [dalam2.bcf [...]]]

Menggabungkan file BCF. File input harus disortir dan memiliki
sampel identik muncul dalam urutan yang sama.

SAM FORMAT


Format Sequence Alignment/Map (SAM) dibatasi TAB. Terlepas dari baris header, yang
diawali dengan simbol `@', setiap garis lurus terdiri dari:

┌────┬───────┬──────────────────────────────────── ──────────────────────┐
KolBidangDeskripsi Produk
├────┼───────┼──────────────────────────────────── ──────────────────────┤
1 QNAME Template kueri/pasangan NAMA
2 BENDERA BENDERA bitwise
3 RNAME Urutan referensi NAMA
4 POS POSISI/koordinat paling kiri berbasis 1 dari urutan terpotong
5 MAPQ Kualitas Pemetaan (Skala Phred)
6 CIAGR string CIGAR diperpanjang
7 MRNM Mate Reference sequence Name (`=' jika sama dengan RNAME)
8 MPOS POSISI Mate berbasis 1
9 TLEN panjang Template yang disimpulkan (ukuran sisipkan)
10 SEQ query SEQuence pada untai yang sama dengan referensi
11 KUALITAS KUALITAS kueri (ASCII-33 memberikan kualitas dasar Phred)
12+ OPT variabel bidang OPSIONAL dalam format TAG:VTYPE:VALUE
└────┴───────┴──────────────────────────────────── ──────────────────────┘

Setiap bit dalam bidang FLAG didefinisikan sebagai:

┌───────┬─────┬─────────────────────────────────── ───────────────┐
BenderachrDeskripsi Produk
├───────┼─────┼─────────────────────────────────── ───────────────┤
0x0001 p pembacaan dipasangkan secara berurutan
0x0002 P pembacaan dipetakan dalam pasangan yang tepat
0x0004 u urutan kueri itu sendiri belum dipetakan
0x0008 U jodoh belum dipetakan
0x0010 r untaian kueri (1 untuk terbalik)
0x0020 R untaian pasangan
0x0040 1 pembacaan adalah pembacaan pertama secara berpasangan
0x0080 2 pembacaan adalah pembacaan kedua secara berpasangan
0x0100 s keselarasan bukan yang utama
0x0200 f pembacaan gagal platform/pemeriksaan kualitas vendor
0x0400 d pembacaan adalah PCR atau duplikat optik
└───────┴─────┴─────────────────────────────────── ───────────────┘
di mana kolom kedua memberikan representasi string dari bidang FLAG.

VCF FORMAT


Format Panggilan Varian (VCF) adalah format yang dibatasi TAB dengan setiap baris data terdiri dari:
bidang berikut:

┌────┬────────┬─────────────────────────────────── ───────────────────────────┐
KolBidangDeskripsi Produk
├────┼────────┼─────────────────────────────────── ───────────────────────────┤
1 CHROM nama CHROMosome
2 POS POSISI paling kiri dari varian
3 ID Pengenal varian unik
4 REF alel Referensi
5 ALT alel ALTernate, dipisahkan dengan koma
6 KUALITAS varian/referensi KUALITAS
7 FILTER FILTER diterapkan
8 INFO INFORMASI terkait varian, dipisahkan dengan titik koma
9 FORMAT FORMAT bidang genotipe, dipisahkan dengan titik dua (opsional)
10+ SAMPEL SAMPEL genotipe dan informasi per sampel (opsional)
└────┴────────┴─────────────────────────────────── ───────────────────────────┘

Tabel berikut memberikan INFO tag yang digunakan oleh samtools dan bcftools.

┌──────┬───────────┬────────────────────────────── ────────────────────────────────────────────────── ────────────────────┐
labeldibentukDeskripsi Produk
├──────┼───────────┼────────────────────────────── ────────────────────────────────────────────────── ────────────────────┤
└──────┴───────────┴────────────────────────────── ────────────────────────────────────────────────── ────────────────────┘

CONTOH


o Impor SAM ke BAM ketika @SQ baris hadir di header:

tampilan samtools -bS aln.sam > aln.bam

If @SQ garis tidak ada:

samtools faidx ref.fa
samtools view -bt ref.fa.fai aln.sam > aln.bam

dimana ref.fa.fai dihasilkan secara otomatis oleh faidx perintah.

o Lampirkan RG tag saat menggabungkan perataan yang diurutkan:

perl -e 'cetak
"@RG\tID:ga\tSM:hs\tLB:ga\tPL:Illumina\n@RG\tID:454\tSM:hs\tLB:454\tPL:454\n"' > rg.txt
samtools gabung -rh rg.txt digabung.bam ga.bam 454.bam

Nilai dalam RG tag ditentukan oleh nama file tempat pembacaan berasal. Di dalam
contoh, di digabung.bam, dibaca dari ga.bam akan dilampirkan RG:Z:ga, sambil membaca dari
454.bam akan dilampirkan RG:Z:454.

o Panggil SNP dan INDEL pendek untuk satu individu diploid:

samtools mpileup -ugf ref.fa aln.bam | tampilan bcftools -bvcg -> var.raw.bcf
tampilan bcftools var.raw.bcf | vcfutils.pl varFilter -D 100 > var.flt.vcf

Grafik -D opsi varFilter mengontrol kedalaman baca maksimum, yang harus disesuaikan dengan
sekitar dua kali rata-rata kedalaman baca. Seseorang dapat mempertimbangkan untuk menambahkan -C50 untuk mpileup jika pemetaan
kualitas terlalu tinggi untuk pembacaan yang mengandung ketidakcocokan yang berlebihan. Menerapkan opsi ini
biasanya membantu BWA-pendek tetapi mungkin tidak pembuat peta lainnya.

o Hasilkan urutan konsensus untuk satu individu diploid:

samtools mpileup -uf ref.fa aln.bam | tampilan bcftools -cg - | vcfutils.pl vcf2fq >
cns.fq

o Panggil mutasi somatik dari sepasang sampel:

samtools mpileup -DSuf ref.fa aln.bam | tampilan bcftools -pasangan bvcgT - > var.bcf

Di bidang INFO keluaran, CLR memberikan rasio Phred-log antara kemungkinan dengan
memperlakukan dua sampel secara independen, dan kemungkinan dengan mengharuskan genotipe untuk
menjadi identik. Ini CLR secara efektif merupakan skor yang mengukur kepercayaan somatic
panggilan. Semakin tinggi semakin baik.

o Panggil de novo dan mutasi somatik dari trio keluarga:

samtools mpileup -DSuf ref.fa aln.bam | tampilan bcftools -bvcgT pair -s sample.txt - >
var.bcf

File sampel.txt harus terdiri dari tiga baris yang menentukan anggota dan urutan
sampel (dalam urutan anak-ayah-ibu). Demikian pula, CLR memberikan Phred-log
rasio kemungkinan dengan dan tanpa kendala trio. UGT menunjukkan kemungkinan besar
konfigurasi genotipe tanpa kendala trio, dan CGT memberikan kemungkinan besar
konfigurasi genotipe memenuhi kendala trio.

o Fase satu individu:

samtools calmd -AEur aln.bam ref.fa | samtools phase -b awalan -> phase.out

Grafik tenang perintah digunakan untuk mengurangi heterozigot palsu di sekitar INDEL.

o Panggil SNP dan indel pendek untuk beberapa individu diploid:

samtools mpileup -P ILLUMINA -ugf ref.fa *.bam | tampilan bcftools -bcvg -> var.raw.bcf
tampilan bcftools var.raw.bcf | vcfutils.pl varFilter -D 2000 > var.flt.vcf

Individu diidentifikasi dari SM tag di @RG garis kepala. Individu dapat menjadi
dikumpulkan dalam satu file pelurusan; satu individu juga dapat dipisahkan menjadi beberapa file.
Grafik -P opsi menentukan bahwa kandidat indel harus dikumpulkan hanya dari grup baca
pada pengatur terkenal. Pengatur ini menawarkan bantuan hukum kepada traderapabila trader berselisih dengan broker yang terdaftar dengan mereka. @RG-PL tag disetel ke TERANG. Mengumpulkan kandidat indel dari bacaan berurutan
oleh teknologi rawan indel dapat mempengaruhi kinerja panggilan indel.

Perhatikan bahwa ada model panggilan baru yang dapat dipanggil oleh

tampilan bcftools -m0.99 ...

yang memperbaiki beberapa batasan parah dari metode default.

Untuk penyaringan, hasil terbaik tampaknya dicapai dengan terlebih dahulu menerapkan SnpGap filter dan
kemudian menerapkan beberapa pendekatan pembelajaran mesin

vcf-anotasi -f SnpGap=n
filter vcf...

Keduanya dapat ditemukan di alat vcf dan htslib paket (tautan di bawah).

o Turunkan spektrum frekuensi alel (AFS) pada daftar situs dari beberapa individu:

samtools mpileup -Igf ref.fa *.bam > all.bcf
bcftools lihat -bl sites.list all.bcf > sites.bcf
bcftools lihat -cGP cond2 sites.bcf > /dev/null 2> sites.1.afs
bcftools lihat -cGP sites.1.afs sites.bcf > /dev/null 2> sites.2.afs
bcftools lihat -cGP sites.2.afs sites.bcf > /dev/null 2> sites.3.afs
......

dimana situs. daftar berisi daftar situs dengan setiap baris terdiri dari referensi
nama urutan dan posisi. Pengikut com.bcftools perintah memperkirakan AFS oleh EM.

o Dump BAQ menerapkan penyelarasan untuk pemanggil SNP lainnya:

samtools calmd -bAr aln.bam > aln.baq.bam

Itu menambah dan mengoreksi NM dan MD tag secara bersamaan. NS tenang perintah juga datang
pada pengatur terkenal. Pengatur ini menawarkan bantuan hukum kepada traderapabila trader berselisih dengan broker yang terdaftar dengan mereka. -C pilihan, sama seperti yang ada di menumpuk dan mpileup. Terapkan jika itu membantu.

PEMBATASAN


o Kata-kata yang tidak selaras digunakan di bam_import.c, bam_endian.h, bam.c dan bam_aux.c.

o Samtools pair-end rmdup tidak berfungsi untuk pembacaan yang tidak berpasangan (mis.
dipetakan ke kromosom yang berbeda). Jika ini adalah masalah, silakan gunakan Picard's
MarkDuplicate yang menangani kasus ini dengan benar, meskipun sedikit lebih lambat.

Gunakan bcftools online menggunakan layanan onworks.net


Server & Workstation Gratis

Unduh aplikasi Windows & Linux

  • 1
    Burung api
    Burung api
    Firebird RDBMS menawarkan fitur ANSI SQL
    & berjalan di Linux, Windows &
    beberapa platform Unix. Fitur
    konkurensi & kinerja yang sangat baik
    & kekuasaan...
    Unduh Firebird.dll
  • 2
    KompoZer
    KompoZer
    KompoZer adalah editor HTML wysiwyg menggunakan
    basis kode Mozilla Composer. Sebagai
    Pengembangan Nvu telah dihentikan
    pada tahun 2005, KompoZer memperbaiki banyak bug dan
    menambahkan f...
    Unduh KompoZer.dll
  • 3
    Pengunduh Manga Gratis
    Pengunduh Manga Gratis
    Pengunduh Manga Gratis (FMD) adalah
    aplikasi sumber terbuka ditulis dalam
    Object-Pascal untuk mengelola dan
    mengunduh manga dari berbagai situs web.
    Ini cermin...
    Unduh Pengunduh Manga Gratis
  • 4
    Aetbootin
    Aetbootin
    UNetbootin memungkinkan Anda membuat bootable
    Drive USB langsung untuk Ubuntu, Fedora, dan
    distribusi Linux lainnya tanpa
    membakar CD. Ini berjalan di Windows, Linux,
    dan ...
    Unduh UNetbootin.dll
  • 5
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM mudah digunakan
    Paket perangkat lunak open source ERP dan CRM
    (dijalankan dengan server php web atau sebagai
    perangkat lunak mandiri) untuk bisnis,
    yayasan...
    Unduh Dolibarr ERP - CRM
  • 6
    Klien SQL SQuirreL
    Klien SQL SQuirreL
    SQuirreL SQL Client adalah SQL grafis
    klien yang ditulis dalam Java yang memungkinkan
    Anda untuk melihat struktur JDBC
    database yang sesuai, jelajahi data di
    meja...
    Unduh SQuirreL SQL Client
  • Lebih banyak lagi »

Perintah Linux

Ad