InglesPransesEspanyol

Ad


OnWorks favicon

bcftools - Online sa Cloud

Patakbuhin ang bcftools sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command na bcftools na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


samtools - Mga Utility para sa Sequence Alignment/Map (SAM) na format

bcftools - Mga Utility para sa Binary Call Format (BCF) at VCF

SINOPSIS


samtools view -bt ref_list.txt -o aln.bam aln.sam.gz

samtools sort aln.bam aln.sorted

samtools index aln.sorted.bam

samtools idxstats aln.sorted.bam

samtools view aln.sorted.bam chr2:20,100,000-20,200,000

samtools merge out.bam in1.bam in2.bam in3.bam

samtools faidx ref.fasta

samtools pileup -vcf ref.fasta aln.sorted.bam

samtools mpileup -C50 -gf ref.fasta -r chr3:1,000-2,000 in1.bam in2.bam

samtools tview aln.sorted.bam ref.fasta

bcftools index sa.bcf

bcftools view in.bcf chr2:100-200 > out.vcf

view ng bcftools -Nvm0.99 in.bcf > out.vcf 2> out.afs

DESCRIPTION


Ang Samtools ay isang set ng mga utility na nagmamanipula ng mga alignment sa BAM na format. Nag-import ito
mula at ine-export sa format na SAM (Sequence Alignment/Map), ginagawa ang pag-uuri, pagsasama at
pag-index, at nagbibigay-daan upang mabawi ang mga nabasa sa anumang rehiyon nang mabilis.

Ang Samtools ay idinisenyo upang gumana sa isang stream. Itinuturing nito ang isang input file na `-' bilang pamantayan
input (stdin) at isang output file `-' bilang karaniwang output (stdout). Ang ilang mga utos ay maaaring
sa gayon ay pinagsama sa mga tubo ng Unix. Ang Samtools ay palaging naglalabas ng babala at mga mensahe ng error sa
karaniwang error na output (stderr).

Nagagawa rin ng Samtools na magbukas ng BAM (hindi SAM) na file sa isang remote na FTP o HTTP server kung ang
Ang pangalan ng BAM file ay nagsisimula sa `ftp://' o `http://'. Sinusuri ng Samtools ang kasalukuyang gumagana
direktoryo para sa index file at ida-download ang index kapag wala. Ang Samtools ay hindi
kunin ang buong alignment file maliban kung ito ay hihilingin na gawin ito.

MGA SAMTOOLS UTOS AT Opsyon


tingnan samtools view [-bchuHS] [-t in.refList] [-o output] [-f reqFlag] [-F skipFlag]
[-q minMapQ] [-l library] [-r readGroup] [-R rgFile] | [rehiyon1
[...]]

I-extract/i-print ang lahat o mga sub alignment sa SAM o BAM na format. Kung walang rehiyon
tinukoy, ang lahat ng mga pagkakahanay ay ipi-print; kung hindi ay mga alignment lamang
ang magkakapatong sa mga tinukoy na rehiyon ay magiging output. Maaaring magbigay ng pagkakahanay
maraming beses kung ito ay nagsasapawan ng ilang rehiyon. Ang isang rehiyon ay maaaring ipakita,
halimbawa, sa sumusunod na format: `chr2' (ang buong chr2), `chr2:1000000'
(rehiyon na nagsisimula sa 1,000,000bp) o `chr2:1,000,000-2,000,000' (rehiyon sa pagitan ng
1,000,000 at 2,000,000bp kasama ang mga end point). Ang coordinate ay 1-based.

OPSYON:

-b Output sa BAM na format.

-f Int Tanging ang mga alignment ng output sa lahat ng mga bit sa INT na nasa field na FLAG.
Maaaring nasa hex ang INT sa format na /^0x[0-9A-F]+/ [0]

-F Int Laktawan ang mga pagkakahanay na may mga bit na nasa INT [0]

-h Isama ang header sa output.

-H I-output ang header lamang.

-l STR Ang output lang ang mababasa sa library STR [null]

-o FILE Output file [stdout]

-q Int Laktawan ang mga alignment na may MAPQ na mas maliit kaysa sa INT [0]

-r STR Ang output lang ang nababasa sa read group na STR [null]

-R FILE Mga nabasang output sa mga binasang pangkat na nakalista sa FILE [wala]

-s Lumutang Fraction ng mga template/pares sa subsample; ang integer na bahagi ay ginagamot
bilang buto para sa random number generator [-1]

-S Ang input ay nasa SAM. Kung ang mga linya ng header ng @SQ ay wala, ang `-t' Ang opsyon ay
kinakailangan.

-c Sa halip na i-print ang mga alignment, bilangin lamang ang mga ito at i-print ang
kabuuang bilang. Lahat ng mga opsyon sa filter, gaya ng `-f', `-F' at `-q' , Ay
isinasaalang-alang.

-t FILE Ang file na ito ay TAB-delimited. Ang bawat linya ay dapat maglaman ng reference na pangalan
at ang haba ng sanggunian, isang linya para sa bawat natatanging sanggunian;
hindi pinapansin ang mga karagdagang field. Tinutukoy din ng file na ito ang pagkakasunud-sunod ng
reference sequences sa pag-uuri. Kung nagpapatakbo ka ng `samtools faidx ',
ang resultang index file .fai maaaring gamitin bilang ito
file.

-u I-output ang hindi naka-compress na BAM. Ang pagpipiliang ito ay nakakatipid ng oras na ginugol sa
compression/decomprssion at sa gayon ay ginustong kapag ang output ay
piped sa isa pang samtools command.

tvview samtools tview [-p chr:pos] [-s STR] [-d magpakita] [ref.fasta]

Text alignment viewer (batay sa ncurses library). Sa viewer, pindutin ang `?'
para sa tulong at pindutin ang `g' upang suriin ang pagsisimula ng alignment mula sa isang rehiyon sa format
tulad ng `chr10:10,000,000' o `=10,000,000' kapag tinitingnan ang parehong reference
pagkakasunod-sunod.

Pagpipilian:

-d magpakita Output bilang (H)tml o (C)urses o (T)ext

-p chr:pos Direktang pumunta sa posisyong ito

-s STR Ipakita lamang ang mga nabasa mula sa sample na ito o read group

mpileup samtools mpileup [-EBugp] [-C capQcoef] [-r reg] [-f sa.fa] [-l listahan] [-M
capMapQ] [-Q minBaseQ] [-q minMapQ] sa.bam [in2.bam [...]]

Bumuo ng BCF o pileup para sa isa o maramihang BAM file. Ang mga talaan ng pagkakahanay ay
nakapangkat ayon sa mga sample na identifier sa @RG header lines. Kung ang mga sample identifier ay
wala, ang bawat input file ay itinuturing na isang sample.

Sa pileup format (nang walang -uor-g), ang bawat linya ay kumakatawan sa isang genomic na posisyon,
na binubuo ng chromosome name, coordinate, reference base, read base, read
mga katangian at alignment mapping na mga katangian. Impormasyon sa tugma, hindi tugma,
indel, strand, kalidad ng pagmamapa at simula at pagtatapos ng isang nabasa ay naka-encode lahat sa
ang nabasang base column. Sa column na ito, ang isang tuldok ay kumakatawan sa isang tugma sa reference
base sa forward strand, isang kuwit para sa isang tugma sa reverse strand, isang '>' o
'<' para sa isang reference skip, `ACGTN' para sa mismatch sa forward strand at
`acgtn' para sa isang mismatch sa reverse strand. Isang pattern `\+[0-9]+[ACGTNacgtn]+'
ay nagpapahiwatig na mayroong pagpapasok sa pagitan ng posisyong ito ng sanggunian at ng susunod
posisyon ng sanggunian. Ang haba ng insertion ay ibinibigay ng integer sa
pattern, na sinusundan ng ipinasok na pagkakasunud-sunod. Katulad nito, isang pattern
Ang `-[0-9]+[ACGTNacgtn]+' ay kumakatawan sa isang pagtanggal mula sa reference. Ang tinanggal
ang mga base ay ipapakita bilang `*' sa mga sumusunod na linya. Gayundin sa read base
column, ang isang simbolo na `^' ay nagmamarka ng simula ng isang pagbasa. Ang ASCII ng karakter
kasunod ng `^' minus 33 ay nagbibigay ng kalidad ng pagmamapa. Ang isang simbolo na `$' ay nagmamarka sa pagtatapos ng
isang read segment.

input Pagpipilian:

-6 Ipagpalagay na ang kalidad ay nasa pag-encode ng Illumina 1.3+. -A Huwag laktawan
maanomalyang mga pares ng pagbasa sa iba't ibang pagtawag.

-B Huwag paganahin ang probabilistic realignment para sa pagkalkula ng base
kalidad ng pagkakahanay (BAQ). Ang BAQ ay ang Phred-scaled na posibilidad ng isang read
base na hindi pagkakatugma. Ang paglalapat ng opsyong ito ay lubos na nakakatulong upang mabawasan
mga maling SNP na dulot ng mga maling pagkakahanay.

-b FILE Listahan ng mga input na BAM file, isang file bawat linya [null]

-C Int Coefficient para sa pag-downgrade ng kalidad ng pagmamapa para sa mga binabasang naglalaman
labis na hindi pagkakatugma. Given a read with a phred-scaled probability q
na nabuo mula sa nakamapang posisyon, ang bagong kalidad ng pagmamapa
ay tungkol sa sqrt((INT-q)/INT)*INT. Ang isang zero na halaga ay hindi pinapagana ito
pag-andar; kung pinagana, ang inirerekomendang halaga para sa BWA ay 50. [0]

-d Int Sa isang posisyon, basahin nang husto Int bumabasa bawat input BAM. [250]

-E Pinalawak na BAQ computation. Ang pagpipiliang ito ay nakakatulong sa pagiging sensitibo lalo na para sa
Mga MNP, ngunit maaaring makasakit ng kaunti sa pagtitiyak.

-f FILE Ang faidx-indexed reference file sa FASTA na format. Ang file ay maaaring
opsyonal na i-compress ng razip. [wala]

-l FILE BED o position list file na naglalaman ng listahan ng mga rehiyon o site kung saan
pileup o BCF ay dapat mabuo [null]

-q Int Pinakamababang kalidad ng pagmamapa para sa isang alignment na gagamitin [0]

-Q Int Pinakamababang kalidad ng base para sa isang base na isasaalang-alang [13]

-r STR Bumuo lamang ng pileup sa rehiyon STR [lahat ng site]

Pagbubuhos Pagpipilian:

-D Output per-sample read depth

-g Kalkulahin ang mga posibilidad ng genotype at i-output ang mga ito sa binary na format ng tawag
(BCF).

-S Output per-sample Phred-scaled strand bias P-value

-u Kapareho ng -g maliban na ang output ay uncompressed BCF, which is
mas gusto para sa piping.

Options para Dyenotayp Malamang Pagtutuos (Para sa -g or -u):

-e Int probabilidad ng error sa sequencing ng extension ng Phred-scaled gap. Pagbawas Int
humahantong sa mas mahabang indels. [20]

-h Int Coefficient para sa pagmomodelo ng mga error sa homopolymer. Nabigyan ng isang l-haba
homopolymer run, ang sequencing error ng isang indel ng laki s ay modelo
as Int*s/l. [100]

-I Huwag magsagawa ng INDEL na pagtawag

-L Int Laktawan ang pagtawag sa INDEL kung ang average na lalim ng bawat sample ay nasa itaas Int.
[250]

-o Int Phred-scaled gap open sequencing error probability. Pagbawas Int humantong
sa mas indel calls. [40]

-p Ilapat ang -m at -F na mga threshold sa bawat sample upang mapataas ang sensitivity ng
tumatawag. Bilang default, inilalapat ang parehong mga opsyon sa mga binasang pinagsama-sama mula sa lahat
mga sample.

-P STR Comma dilimited na listahan ng mga platform (tinukoy ng @RG-PL) mula saan
nakuha ang mga kandidato ng indel. Inirerekomenda na mangolekta ng indel
mga kandidato mula sa mga teknolohiya ng sequencing na may mababang rate ng error sa indel
tulad ng ILLUMINA. [lahat]

reheader samtools reheader

Palitan ang header sa.bam kasama ang header sa.header.sam. Ang utos na ito ay
mas mabilis kaysa sa pagpapalit ng header ng BAM->SAM->BAM conversion.

pusa samtools cat [-h header.sam] [-o out.bam] [ ... ]

Pagsamahin ang mga BAM. Ang sequence dictionary ng bawat input BAM ay dapat magkapareho,
bagaman hindi ito sinusuri ng utos na ito. Gumagamit ang command na ito ng katulad na trick sa
reheader na nagbibigay-daan sa mabilis na pagsasama-sama ng BAM.

uri samtools sort [-nof] [-m maxMem]

Pagbukud-bukurin ang mga alignment ayon sa pinakakaliwang coordinate. file .bam ay malilikha.
Ang utos na ito ay maaari ding lumikha ng mga pansamantalang file .%d.bam kapag ang kabuuan
Ang pagkakahanay ay hindi maaaring mailagay sa memorya (kinokontrol ng opsyon -m).

OPSYON:

-o I-output ang panghuling pagkakahanay sa karaniwang output.

-n Pagbukud-bukurin ayon sa mga nabasang pangalan sa halip na ayon sa mga chromosomal coordinates

-f paggamit bilang ang buong output path at huwag idagdag .bam hulapi.

-m Int Tinatayang ang pinakamataas na kinakailangang memorya. [500000000]

pagsamahin samtools merge [-nur1f] [-h inh.sam] [-R reg]
[...]

Pagsamahin ang maramihang pinagsunod-sunod na pagkakahanay. Ang header reference listahan ng lahat ng input
BAM file, at ang @SQ header ng inh.sam, kung mayroon man, dapat lahat ay sumangguni sa pareho
set ng mga reference sequence. Ang listahan ng sanggunian ng header at (maliban kung na-override ng
-h) `@' mga header ng in1.bam ay kokopyahin sa out.bam, at ang mga header ng iba pa
hindi papansinin ang mga file.

OPSYON:

-1 Gamitin ang zlib compression level 1 para i-comrpess ang output

-f Pilitin na i-overwrite ang output file kung naroroon.

-h FILE Gamitin ang mga linya ng FILE bilang `@' na mga header na kokopyahin out.bam, pagpapalit
anumang mga linya ng header na kung hindi man ay makokopya mula sa in1.bam. (FILE is
aktwal na nasa format na SAM, kahit na ang anumang mga tala ng pagkakahanay na maaaring naglalaman nito ay
hindi pinapansin.)

-n Ang mga alignment ng input ay pinagsunod-sunod ayon sa mga nabasang pangalan sa halip na sa pamamagitan ng chromosomal
coordinates

-R STR Pagsamahin ang mga file sa tinukoy na rehiyon na ipinahiwatig ng STR [wala]

-r Maglakip ng RG tag sa bawat alignment. Ang halaga ng tag ay hinuha mula sa file
mga pangalan.

-u Hindi naka-compress na BAM na output

index samtools index

Index sorted alignment para sa mabilis na random na pag-access. Index file .bai ay
nilikha.

idxstats samtools idxstats

Kunin at i-print ang mga istatistika sa index file. Ang output ay TAB delimited sa
bawat linya na binubuo ng reference sequence name, sequence length, # mapped reads
at # hindi naka-map na nabasa.

faidx samtools faidx [rehiyon1 [...]]

Index reference sequence sa FASTA na format o i-extract ang kasunod mula sa na-index
pagkakasunud-sunod ng sanggunian. Kung walang tinukoy na rehiyon, faidx ay i-index ang file at
lumikha .fai sa disk. Kung ang mga rehiyon ay tinukoy, ang mga kasunod
ay kukunin at ipi-print sa stdout sa FASTA na format. Ang input file ay maaari
i-compress sa RAZF format.

fixmate samtools fixmate

Punan ang mga coordinate ng kapareha, ISIZE at mga kaugnay na flag ng kapareha mula sa isang pinagsunod-sunod na pangalan
pagkakahanay

rmdup samtools rmdup [-sS]

Alisin ang mga potensyal na PCR duplicate: kung maraming pares ng read ay may magkaparehong panlabas
mga coordinate, panatilihin lamang ang pares na may pinakamataas na kalidad ng pagmamapa. Sa magkapares-
end mode, ang utos na ito LAMANG gumagana sa FR na oryentasyon at nangangailangan ng ISIZE ay
wastong itinakda. Hindi ito gumagana para sa mga hindi nakapares na pagbabasa (hal. dalawang dulo na nakamapa sa
iba't ibang chromosome o orphan reads).

OPSYON:

-s Alisin ang duplicate para sa single-end reads. Bilang default, gumagana ang command para sa
paired-end reads lang.

-S Tratuhin ang mga paired-end reads at single-end reads.

napatahimik napatahimik ang samtools [-EeubSr] [-C capQcoef]

Bumuo ng MD tag. Kung ang MD tag ay naroroon na, ang utos na ito ay magbibigay ng a
babala kung ang nabuong MD tag ay iba sa kasalukuyang tag. Output SAM
bilang default.

OPSYON:

-A Kapag ginamit kasabay ng -r pinatungan ng opsyong ito ang orihinal na base
kalidad.

-e I-convert ang isang read base sa = kung ito ay kapareho ng nakahanay na sanggunian
base. Hindi sinusuportahan ng Indel caller ang = base sa ngayon.

-u I-output ang hindi naka-compress na BAM

-b Naka-compress na BAM ang output

-S Ang input ay SAM na may mga linya ng header

-C Int Coefficient upang i-cap ang kalidad ng pagmamapa ng mga hindi magandang nakamapang nabasa. Tingnan ang
pileup utos para sa mga detalye. [0]

-r Kalkulahin ang BQ tag (walang -A) o cap base na kalidad ng BAQ (na may -A).

-E Pinalawak na pagkalkula ng BAQ. Ang pagpipiliang ito ay nakikipagkalakalan sa pagtitiyak para sa
pagiging sensitibo, kahit na ang epekto ay maliit.

targetcut samtools targetcut [-Q minBaseQ] [-i inPenalty] [-0 em0] [-1 em1] [-2 em2] [-f
ref]

Tinutukoy ng command na ito ang mga target na rehiyon sa pamamagitan ng pagsusuri sa pagpapatuloy ng pagbabasa
depth, kino-compute ang haploid consensus sequence ng mga target at naglalabas ng isang SAM na may
bawat sequence na tumutugma sa isang target. Kapag option -f ay ginagamit, BAQ ay magiging
inilapat. Ang utos na ito ay lamang dinisenyo para sa pagputol ng fosmid clone mula sa fosmid
pagkakasunud-sunod ng pool [Ref. Kitzman et al. (2010)].

pagbabago ng isang bagay samtools phase [-AF] [-k len] [-b prefix] [-q minLOD] [-Q minBaseQ]

Tawag at phase heterozygous SNPs. OPSYON:

-A I-drop ang mga nabasa na may hindi tiyak na yugto.

-b STR Prefix ng BAM output. Kapag ginagamit ang opsyong ito, magiging phase-0 ang mga pagbabasa
naka-save sa file STR.0.bam at phase-1 reads in STR.1.bam. Hindi alam ang yugto
Ang mga nabasa ay random na ilalaan sa isa sa dalawang file. Nagbabasa ng chimeric
na may switch error ay ise-save sa STR.chimeric.bam. [wala]

-F Huwag subukang ayusin ang mga chimeric reads.

-k Int Pinakamataas na haba para sa lokal na pag-phase. [13]

-q Int Minimum na Phred-scaled na LOD para makatawag ng heterozygote. [40]

-Q Int Minimum na kalidad ng base na gagamitin sa het calling. [13]

BCFTOOLS UTOS AT Opsyon


tingnan bcftools tingnan [-AbFGNQSucgv] [-D seqDict] [-l listLoci] [-s listSample] [-i
gapSNPratio] [-t mutRate] [-p varThres] [-m varThres] [-P bago] [-1 nPangkat1]
[-d minFrac] [-U nPerm] [-X permThres] [-T trioType] sa.bcf [rehiyon]

Mag-convert sa pagitan ng BCF at VCF, tumawag sa mga variant na kandidato at tantiyahin ang allele
mga frequency.

Input / Output Pagpipilian:

-A Panatilihin ang lahat ng posibleng alternatibong alleles sa iba't ibang mga site. Bilang default,
ang view command ay nagtatapon ng mga hindi malamang na alleles.

-b Output sa BCF format. Ang default ay VCF.

-D FILE Sequence dictionary (listahan ng mga chromosome name) para sa VCF->BCF conversion
[wala]

-F Ipahiwatig ang PL ay nabuo ng r921 o bago (iba ang pag-order).

-G Pigilan ang lahat ng indibidwal na impormasyon ng genotype.

-l FILE Listahan ng mga site kung saan inilalabas ang impormasyon [lahat ng mga site]

-N Laktawan ang mga site kung saan ang REF field ay hindi A/C/G/T

-Q I-output ang format ng posibilidad ng QCALL

-s FILE Listahan ng mga sample na gagamitin. Ang unang column sa input ay nagbibigay ng sample
mga pangalan at ang pangalawa ay nagbibigay ng ploidy, na maaari lamang maging 1 o 2. Kapag
ang 2nd column ay wala, ang sample ploidy ay ipinapalagay na 2. Sa
output, ang pag-order ng mga sample ay magiging magkapareho sa isa sa FILE.
[wala]

-S Ang input ay VCF sa halip na BCF.

-u Hindi naka-compress na BCF output (force -b).

Consensus/Variant Pagtawag Pagpipilian:

-c Mga variant ng tawag gamit ang Bayesian inference. Awtomatikong ang pagpipiliang ito
humihingi ng opsyon -e.

-d Lumutang Kailan -v ay ginagamit, laktawan ang loci kung saan ang bahagi ng mga sample ay sakop ng
ang mga nabasa ay nasa ibaba ng FLOAT. [0]

-e Magsagawa lamang ng max-likelihood inference, kabilang ang pagtantya sa site
dalas ng allele, pagsubok sa Hardy-Weinberg equlibrium at pagsubok
asosasyon sa LRT.

-g Tumawag sa bawat-sample na genotype sa mga variant na site (force -c)

-i Lumutang Ratio ng INDEL-to-SNP mutation rate [0.15]

-m Lumutang Bagong modelo para sa pinahusay na multiallelic at rare-variant na pagtawag. Isa pa
Ang ALT allele ay tinatanggap kung ang P(chi^2) ng LRT ay lumampas sa FLOAT threshold.
Ang parameter ay tila matatag at ang aktwal na halaga ay karaniwang hindi
makakaapekto nang malaki sa mga resulta; ang magandang halaga na gagamitin ay 0.99. Ito ang
inirerekomendang paraan ng pagtawag. [0]

-p Lumutang Ang isang site ay itinuturing na isang variant kung P(ref|D)

-P STR Bago o paunang allele frequency spectrum. Kung pwede ang STR ganap, kundisyon2,
patag o ang file na binubuo ng error na output mula sa isang nakaraang variant
tumatawag ng tumakbo.

-t Lumutang Naka-scale na muttion rate para sa variant na pagtawag [0.001]

-T STR I-enable ang pares/trio calling. Para sa trio na pagtawag, opsyon -s ay karaniwang
kailangang ilapat upang i-configure ang tatlong miyembro at ang kanilang pag-order.
Sa file na ibinigay sa opsyon -s, ang unang sample ay dapat ang
anak, ang pangalawa ay ang ama at ang pangatlo ay ang ina. Ang valid
mga halaga ng STR ay `pair', `trioauto', `trioxd' at `trioxs', kung saan
Ang `pair' ay tumatawag sa mga pagkakaiba sa pagitan ng dalawang input sample, at `trioxd'
(`trioxs') ay tumutukoy na ang input ay mula sa X chromosome na hindi PAR
rehiyon at ang bata ay babae (lalaki). [wala]

-v Mga site ng variant ng output lamang (force -c)

Kaibahan Pagtawag at Kaugnayan Pagsubok Pagpipilian:

-1 Int Bilang ng mga sample ng pangkat-1. Ang pagpipiliang ito ay ginagamit para sa paghahati ng
sample sa dalawang grupo para sa contrast SNP calling o association test.
Kapag ginagamit ang opsyong ito, ilalabas ang sumusunod na VCF INFO:
PC2, PCHI2 at QCHI2. [0]

-U Int Bilang ng mga permutasyon para sa pagsusulit ng asosasyon (epektibo lamang sa -1)
[0]

-X Lumutang Magsagawa lamang ng mga permutasyon para sa P(chi^2) -U)
[0.01]

index bcftools index sa.bcf

Inayos ng index ang BCF para sa random na pag-access.

pusa bcftools pusa sa1.bcf [sa2.bcf [...]]]

Pagsamahin ang mga BCF file. Ang mga input file ay kinakailangang pagbukud-bukurin at magkaroon
magkaparehong mga sample na lumalabas sa parehong pagkakasunud-sunod.

Sam FORMAT


Ang format ng Sequence Alignment/Map (SAM) ay TAB-delimited. Bukod sa mga linya ng header, na
ay nagsimula sa simbolong `@', ang bawat linya ng pagkakahanay ay binubuo ng:

┌────┬───────┬──────────────────────────────────── ──────────────────────┐
SiyaPatlangpaglalarawan
├────┼───────┼──────────────────────────────────── ──────────────────────┤
│ 1 │ QNAME │ Query template/pares NAME │
│ 2 │ FLAG │ bitwise FLAG │
│ 3 │ RNAME │ Reference sequence NAME │
│ 4 │ POS │ 1-based pinakakaliwang POSition/coordinate ng clipped sequence │
│ 5 │ MAPQ │ Kalidad ng MAP (Phred-scaled) │
│ 6 │ CIAGR │ extended CIGAR string │
│ 7 │ MRNM │ Reference sequence ng Mate NaMe (`=' kung pareho sa RNAME) │
│ 8 │ MPOS │ 1-based Mate POSistion │
│ 9 │ TLEN │ inferred Template LENgth (insert size) │
│10 │ SEQ │ query SEQuence sa parehong strand bilang reference │
│11 │ QUAL │ QUALity ng query (Binibigyan ng ASCII-33 ang kalidad ng Phred base) │
│12+ │ OPT │ variable OPtional na mga field sa format na TAG:VTYPE:VALUE │
└────┴───────┴──────────────────────────────────── ──────────────────────┘

Ang bawat bit sa field na FLAG ay tinukoy bilang:

┌───────┬─────┬─────────────────────────────────── ───────────────┐
BandilaBCpaglalarawan
├───────┼─────┼─────────────────────────────────── ───────────────┤
│0x0001 │ p │ ang nabasa ay ipinares sa pagkakasunud-sunod │
│0x0002 │ P │ ang nabasa ay nakamapa sa tamang pares │
│0x0004 │ u │ ang mismong pagkakasunod-sunod ng query ay hindi naka-map │
│0x0008 │ U │ ang asawa ay na-unmapa │
│0x0010 │ r │ strand ng query (1 para sa reverse) │
│0x0020 │ R │ hibla ng asawa │
│0x0040 │ 1 │ ang nabasa ay ang unang nabasa sa isang pares │
│0x0080 │ 2 │ ang nabasa ay ang pangalawang pagbasa sa isang pares │
│0x0100 │ s │ hindi pangunahin ang pagkakahanay │
│0x0200 │ f │ hindi nabasa ang mga pagsusuri sa kalidad ng platform/vendor │
│0x0400 │ d │ ang nabasa ay maaaring PCR o optical duplicate │
└───────┴─────┴─────────────────────────────────── ───────────────┘
kung saan ang pangalawang column ay nagbibigay ng string na representasyon ng FLAG field.

CFV FORMAT


Ang Variant Call Format (VCF) ay isang TAB-delimited na format na binubuo ng bawat linya ng data
ang mga sumusunod na field:

┌────┬────────┬─────────────────────────────────── ───────────────────────────┐
SiyaPatlangpaglalarawan
├────┼────────┼─────────────────────────────────── ───────────────────────────┤
│ 1 │ CHROM │ Pangalan ng CHROMosome │
│ 2 │ POS │ ang pinakakaliwang POSition ng variant │
│ 3 │ ID │ natatanging variant IDentifier │
│ 4 │ REF │ ang REFERENCE allele │
│ 5 │ ALT │ ang (mga) ALTernate allele, na pinaghihiwalay ng kuwit │
│ 6 │ QUAL │ variant/reference KALIDAD │
│ 7 │ FILTER │ Inilapat ang mga FILTER │
│ 8 │ IMPORMASYON │ IMPORMASYON na nauugnay sa variant, na pinaghihiwalay ng semi-colon │
│ 9 │ FORMAT │ FORMAT ng mga genotype field, na pinaghihiwalay ng colon (opsyonal) │
│10+ │ SAMPLE │ SAMPLE genotypes at per-sample na impormasyon (opsyonal) │
└────┴────────┴─────────────────────────────────── ───────────────────────────┘

Ang sumusunod na talahanayan ay nagbibigay ng IMPORMASYON mga tag na ginagamit ng samtools at bcftools.

┌──────┬───────────┬────────────────────────────── ────────────────────────────────────────────────── ────────────────────┐
Tagformatpaglalarawan
├──────┼───────────┼────────────────────────────── ────────────────────────────────────────────────── ────────────────────┤
└──────┴───────────┴────────────────────────────── ────────────────────────────────────────────────── ────────────────────┘

HALIMBAWA


o Mag-import ng SAM sa BAM kapag @SQ ang mga linya ay naroroon sa header:

samtools view -bS aln.sam > aln.bam

If @SQ wala ang mga linya:

samtools faidx ref.fa
samtools view -bt ref.fa.fai aln.sam > aln.bam

saan ref.fa.fai ay awtomatikong nabuo ng faidx utos.

o Ikabit ang RG tag habang pinagsasama ang mga pinagsunod-sunod na pagkakahanay:

perl -e 'print
"@RG\tID:ga\tSM:hs\tLB:ga\tPL:Illumina\n@RG\tID:454\tSM:hs\tLB:454\tPL:454\n"' > rg.txt
samtools merge -rh rg.txt merged.bam ga.bam 454.bam

Ang halaga sa a RG Ang tag ay tinutukoy ng pangalan ng file kung saan nagmumula ang nabasa. Dito sa
halimbawa, sa pinagsanib.bam, nagbabasa mula sa ga.bam ikakabit RG:Z:ga, habang binabasa mula sa
454.bam ikakabit RG:Z:454.

o Tumawag sa mga SNP at maikling INDEL para sa isang diploid na indibidwal:

samtools mpileup -ugf ref.fa aln.bam | bcftools view -bvcg - > var.raw.bcf
bcftools view var.raw.bcf | vcfutils.pl varFilter -D 100 > var.flt.vcf

Ang -D kinokontrol ng opsyon ng varFilter ang maximum na lalim ng pagbasa, na dapat iakma sa
humigit-kumulang dalawang beses ang average na lalim ng pagbasa. Maaaring isaalang-alang ng isa na magdagdag -C50 sa mpileup kung pagmamapa
ang kalidad ay overestimated para sa mga nabasa na naglalaman ng labis na hindi pagkakatugma. Paglalapat ng opsyong ito
kadalasan ay nakakatulong BWA-maikli ngunit maaaring hindi iba pang mga mappers.

o Bumuo ng consensus sequence para sa isang diploid na indibidwal:

samtools mpileup -uf ref.fa aln.bam | bcftools view -cg - | vcfutils.pl vcf2fq >
cns.fq

o Tumawag ng somatic mutations mula sa isang pares ng mga sample:

samtools mpileup -DSuf ref.fa aln.bam | bcftools view -bvcgT pair - > var.bcf

Sa field ng output INFO, CLR nagbibigay ng Phred-log ratio sa pagitan ng posibilidad ng
independiyenteng pagtrato sa dalawang sample, at ang posibilidad sa pamamagitan ng pag-aatas sa genotype
maging magkapareho. Ito CLR ay epektibong isang marka na sumusukat sa kumpiyansa ng somatic
mga tawag. Mas mataas ang mas mahusay.

o Tawagan ang de novo at somatic mutations mula sa isang family trio:

samtools mpileup -DSuf ref.fa aln.bam | bcftools view -bvcgT pair -s samples.txt - >
var.bcf

talaksan samples.txt dapat binubuo ng tatlong linya na tumutukoy sa miyembro at pagkakasunud-sunod ng
mga sample (sa pagkakasunud-sunod ng anak-ama-ina). Katulad nito, CLR nagbibigay ng Phred-log
ratio ng posibilidad na may at walang trio constraint. CGU nagpapakita ng pinaka-malamang
pagsasaayos ng genotype nang walang trio constraint, at CGT nagbibigay ng pinaka-malamang
genotype configuration na nakakatugon sa trio constraint.

o Phase one na indibidwal:

samtools calmd -AEur aln.bam ref.fa | samtools phase -b prefix - > phase.out

Ang napatahimik Ang command ay ginagamit upang bawasan ang mga maling heterozygotes sa paligid ng mga INDEL.

o Tumawag sa mga SNP at maikling indel para sa maraming diploid na indibidwal:

samtools mpileup -P ILLUMINA -ugf ref.fa *.bam | bcftools view -bcvg - > var.raw.bcf
bcftools view var.raw.bcf | vcfutils.pl varFilter -D 2000 > var.flt.vcf

Nakikilala ang mga indibidwal mula sa SM mga tag sa @RG mga linya ng header. Ang mga indibidwal ay maaaring
pinagsama sa isang alignment file; ang isang indibidwal ay maaari ding paghiwalayin sa maramihang mga file.
Ang -P Tinutukoy ng opsyon na ang mga kandidatong indel ay dapat kolektahin lamang mula sa mga binasang grupo
sa @RG-PL nakatakda ang tag sa ILLUMINA. Pagkolekta ng mga kandidato sa indel mula sa mga nabasa na sequenced
sa pamamagitan ng teknolohiyang indel-prone ay maaaring makaapekto sa pagganap ng indel calling.

Tandaan na mayroong bagong modelo ng pagtawag na maaaring i-invoke ni

view ng bcftools -m0.99 ...

na nag-aayos ng ilang matinding limitasyon ng default na paraan.

Para sa pag-filter, ang pinakamahusay na mga resulta ay tila nakakamit sa pamamagitan ng unang paglalapat ng SnpGap filter at
pagkatapos ay nag-aaplay ng ilang machine learning approach

vcf-annotate -f SnpGap=n
filter ng vcf...

Parehong makikita sa vcftools at htslib package (mga link sa ibaba).

o Kunin ang allele frequency spectrum (AFS) sa isang listahan ng mga site mula sa maraming indibidwal:

samtools mpileup -Igf ref.fa *.bam > all.bcf
bcftools view -bl sites.list all.bcf > sites.bcf
bcftools view -cGP cond2 sites.bcf > /dev/null 2> sites.1.afs
bcftools view -cGP sites.1.afs sites.bcf > /dev/null 2> sites.2.afs
bcftools view -cGP sites.2.afs sites.bcf > /dev/null 2> sites.3.afs
......

saan sites.list naglalaman ng listahan ng mga site na may bawat linya na binubuo ng sanggunian
pangalan at posisyon ng pagkakasunud-sunod. Ang mga sumusunod bcftools tinatantya ng mga command ang AFS ng EM.

o Dump BAQ inilapat na pagkakahanay para sa iba pang mga tumatawag sa SNP:

samtools calmd -bAr aln.bam > aln.baq.bam

Ito ay nagdaragdag at nagwawasto sa NM at MD sabay-sabay na mga tag. Ang napatahimik dumating din ang utos
sa -C opsyon, kapareho ng nasa pileup at mpileup. Mag-apply kung ito ay makakatulong.

LIMITASYON


o Mga salitang hindi magkatugma na ginamit sa bam_import.c, bam_endian.h, bam.c at bam_aux.c.

o Samtools paired-end rmdup ay hindi gumagana para sa mga unpared reads (hal orphan reads or ends
nakamapa sa iba't ibang chromosome). Kung ito ay isang alalahanin, mangyaring gamitin ang Picard's
MarkDuplicate na wastong humahawak sa mga kasong ito, bagama't medyo mabagal.

Gumamit ng bcftools online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

  • 1
    Firebird
    Firebird
    Nag-aalok ang Firebird RDBMS ng mga tampok ng ANSI SQL
    & tumatakbo sa Linux, Windows at
    ilang mga platform ng Unix. Mga tampok
    mahusay na pagkakatugma at pagganap
    at kapangyarihan...
    I-download ang Firebird
  • 2
    KompoZer
    KompoZer
    Ang KompoZer ay isang wysiwyg HTML editor gamit ang
    ang Mozilla Composer codebase. Bilang
    Nahinto ang pag-unlad ni Nvu
    noong 2005, inaayos ng KompoZer ang maraming mga bug at
    nagdadagdag ng f...
    I-download ang KompoZer
  • 3
    Libreng Manga Downloader
    Libreng Manga Downloader
    Ang Libreng Manga Downloader (FMD) ay isang
    open source application na nakasulat sa
    Object-Pascal para sa pamamahala at
    pag-download ng manga mula sa iba't ibang mga website.
    Isa itong salamin...
    I-download ang Libreng Manga Downloader
  • 4
    Aetbootin
    Aetbootin
    Hinahayaan ka ng UNetbootin na lumikha ng bootable
    Mga live na USB drive para sa Ubuntu, Fedora, at
    iba pang mga pamamahagi ng Linux nang wala
    nagsusunog ng CD. Gumagana ito sa Windows, Linux,
    at ...
    I-download ang UNetbootin
  • 5
    Dolibar ERP - CRM
    Dolibar ERP - CRM
    Dolibarr ERP - Ang CRM ay isang madaling gamitin
    ERP at CRM open source software package
    (tumatakbo gamit ang isang web php server o bilang
    standalone na software) para sa mga negosyo,
    mga pundasyon...
    I-download ang Dolibar ERP - CRM
  • 6
    SQuirreL SQL Client
    SQuirreL SQL Client
    Ang SQuirreL SQL Client ay isang graphical na SQL
    client na nakasulat sa Java na magpapahintulot
    mong tingnan ang istraktura ng isang JDBC
    sumusunod na database, i-browse ang data sa
    mga mesa...
    I-download ang SQuirreL SQL Client
  • Marami pa »

Linux command

Ad