EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

bcftools - Online în cloud

Rulați bcftools în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda bcftools care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


samtools - Utilități pentru formatul Sequence Alignment/Map (SAM).

bcftools - Utilități pentru formatul de apel binar (BCF) și VCF

REZUMAT


vizualizare samtools -bt ref_list.txt -o aln.bam aln.sam.gz

samtools sort aln.bam aln.sorted

samtools index aln.sorted.bam

samtools idxstats aln.sorted.bam

samtools vizualiza aln.sorted.bam chr2:20,100,000-20,200,000

samtools merge out.bam in1.bam in2.bam in3.bam

samtools faidx ref.fasta

samtools pileup -vcf ref.fasta aln.sorted.bam

samtools miileup -C50 -gf ref.fasta -r chr3:1,000-2,000 in1.bam in2.bam

samtools tview aln.sorted.bam ref.fasta

bcftools index în.bcf

bcftools vizualizați în.bcf chr2:100-200 > out.vcf

vizualizare bcftools -Nvm0.99 in.bcf > out.vcf 2> out.afs

DESCRIERE


Samtools este un set de utilitare care manipulează aliniamentele în format BAM. Se importă
din și exportă în format SAM (Sequence Alignment/Map), sortează, îmbină și
indexare și permite preluarea rapidă a citirilor în orice regiune.

Samtools este proiectat să funcționeze pe un flux. Consideră un fișier de intrare „-” ca standard
intrare (stdin) și un fișier de ieșire `-' ca ieșire standard (stdout). Mai multe comenzi pot
astfel fi combinat cu conducte Unix. Samtools trimite întotdeauna mesaje de avertizare și de eroare către
ieșire de eroare standard (stderr).

Samtools este, de asemenea, capabil să deschidă un fișier BAM (nu SAM) pe un server FTP sau HTTP la distanță dacă
Numele fișierului BAM începe cu „ftp://” sau „http://”. Samtools verifică funcționarea curentă
directorul pentru fișierul index și va descărca indexul în caz de absență. Samtools nu
preluați întregul fișier de aliniere, cu excepția cazului în care i se cere acest lucru.

SAMTOOLS COMANDE AND OPŢIUNI


Vizualizează vizualizare samtools [-bchuHS] [-t in.refList] [-o output] [-f reqFlag] [-F skipFlag]
[-q minMapQ] [-l bibliotecă] [-r readGroup] [-R rgFile] | [regiunea 1
[...]]

Extrageți/printați toate sau sub-aliniamentele în format SAM sau BAM. Dacă nicio regiune nu este
specificat, toate aliniamentele vor fi tipărite; altfel doar aliniamente
suprapunerea regiunilor specificate va fi scoasă la evidență. Se poate da o aliniere
de mai multe ori dacă se suprapune mai multe regiuni. Se poate prezenta o regiune,
de exemplu, în următorul format: „chr2” (întregul chr2), „chr2:1000000”
(regiune care începe de la 1,000,000 pb) sau „chr2:1,000,000-2,000,000” (regiune între
1,000,000 și 2,000,000 pb inclusiv punctele finale). Coordonatele sunt bazate pe 1.

OPȚIUNI:

-b Ieșire în format BAM.

-f INT Ieșiți numai aliniamente cu toți biții din INT prezenți în câmpul FLAG.
INT poate fi în hexadecimal în formatul /^0x[0-9A-F]+/ [0]

-F INT Omite aliniamentele cu biții prezenți în INT [0]

-h Includeți antetul în rezultat.

-H Ieșiți numai antetul.

-l STR Numai citirile de ieșire din biblioteca STR [null]

-o FILE Fișier de ieșire [stdout]

-q INT Omiteți aliniamentele cu MAPQ mai mic decât INT [0]

-r STR Numai ieșirea citește în grupul de citire STR [null]

-R FILE Ieșirea citește în grupurile de citire enumerate în FILE [nul]

-s PLUTI Fracția de șabloane/perechi la subeșantion; se tratează partea întreagă
ca sămânță pentru generatorul de numere aleatoare [-1]

-S Intrarea este în SAM. Dacă liniile de antet @SQ sunt absente, `-t' opțiunea este
necesar.

-c În loc să imprimați aliniamentele, numărați-le doar și imprimați
numărul total. Toate opțiunile de filtrare, cum ar fi `-f', `-F' și `-q' , sunt
luat in considerare.

-t FILE Acest fișier este delimitat de TAB. Fiecare linie trebuie să conțină numele de referință
și lungimea referinței, câte o linie pentru fiecare referință distinctă;
câmpurile suplimentare sunt ignorate. Acest fișier definește, de asemenea, ordinea
secvențe de referință în sortare. Dacă rulați `samtools faidx ',
fișierul index rezultat .fai poate fi folosit astfel
fișier.

-u Ieșire BAM necomprimat. Această opțiune economisește timpul petrecut
compresie/decompresie și este, prin urmare, preferată atunci când ieșirea este
transmis la o altă comandă samtools.

vizionare samtools tview [-p chr:poz] [-s STR] [-d afișa] [ref.fasta]

Vizualizator de aliniere a textului (bazat pe biblioteca ncurses). În vizualizator, apăsați `?'
pentru ajutor și apăsați `g' pentru a verifica începutul alinierii dintr-o regiune în format
cum ar fi „chr10:10,000,000” sau „=10,000,000” când vizualizați aceeași referință
secvenţă.

Opțiuni:

-d afișa Ieșire ca (H)tml sau (C)urses sau (T)ext

-p chr:poz Mergeți direct în această poziție

-s STR Afișați numai citirile din acest eșantion sau grup de citire

empileup samtools miileup [-EBugp] [-C capQcoef] [-r reg] [-f în.fa] [-l listă] [-M
capMapQ] [-Q minBaseQ] [-q minMapQ] în.bam [in2.bam [...]]

Generați BCF sau pileup pentru unul sau mai multe fișiere BAM. Înregistrările de aliniere sunt
grupate după identificatori de eșantion în liniile antetului @RG. Dacă identificatorii eșantionului sunt
absent, fiecare fișier de intrare este considerat un singur eșantion.

În format pileup (fără -uor-g), fiecare linie reprezintă o poziție genomică,
constând din denumirea cromozomului, coordonatele, baza de referință, bazele citite, citirea
calități și calități de mapare a alinierii. Informații despre potrivire, nepotrivire,
indel, strand, calitatea cartografierii și începutul și sfârșitul unei citiri sunt toate codificate la
coloana de bază citită. La această coloană, un punct reprezintă o potrivire cu referința
baza pe șuvița înainte, o virgulă pentru o potrivire pe șuvița inversă, un „>” sau
„<” pentru un salt de referință, „ACGTN” pentru o nepotrivire pe firul înainte și
`acgtn' pentru o nepotrivire pe firul invers. Un model `\+[0-9]+[ACGTNacgtn]+'
indică existența unei inserții între această poziție de referință și următoarea
pozitia de referinta. Lungimea inserției este dată de numărul întreg în
model, urmat de secvența inserată. În mod similar, un model
„-[0-9]+[ACGTNacgtn]+” reprezintă o ștergere din referință. Cele șterse
bazele vor fi prezentate ca `*' în rândurile următoare. Tot la baza de citire
coloană, simbolul „^” marchează începutul unei citiri. ASCII al personajului
după `^' minus 33 oferă calitatea cartografierii. Un simbol „$” marchează sfârșitul
un segment citit.

Intrare Opțiuni:

-6 Să presupunem că calitatea este în codificarea Illumina 1.3+. -A Nu sări peste
perechi de citire anormale în apelarea variantei.

-B Dezactivați realinierea probabilistică pentru calculul bazei
calitatea alinierii (BAQ). BAQ este probabilitatea la scară Phred a unei citiri
baza fiind nealiniată. Aplicarea acestei opțiuni ajută foarte mult la reducerea
SNP false cauzate de nealinieri.

-b FILE Lista fișierelor BAM de intrare, un fișier pe linie [null]

-C INT Coeficient pentru reducerea calității mapării pentru citirile care conțin
nepotriviri excesive. Având în vedere o citire cu o probabilitate q la scară phred
de a fi generate din poziția mapată, noua calitate de cartografiere
este de aproximativ sqrt((INT-q)/INT)*INT. O valoare zero dezactivează acest lucru
funcționalitate; dacă este activată, valoarea recomandată pentru BWA este 50. [0]

-d INT Într-o poziție, citiți maxim INT citiri pe intrare BAM. [250]

-E Calcul BAQ extins. Această opțiune ajută la sensibilitate mai ales pentru
MNPs, dar poate afecta puțin specificitatea.

-f FILE faidx-fișier de referință indexat în format FASTA. Dosarul poate fi
opțional comprimat de zip. [nul]

-l FILE BED sau fișier cu listă de poziții care conține o listă de regiuni sau site-uri în care
ar trebui generat pileup sau BCF [null]

-q INT Calitate minimă de cartografiere pentru un aliniere care urmează să fie utilizat [0]

-Q INT Calitatea minimă a bazei pentru o bază care trebuie luată în considerare [13]

-r STR Generați acumulare numai în regiune STR [toate site-urile]

producție Opțiuni:

-D Adâncimea de citire de ieșire per eșantion

-g Calculați probabilitățile genotipului și scoateți-le în format de apel binar
(BCF).

-S Ieșire per eșantion Valoarea P de polarizare a firelor la scară Phred

-u similar -g cu excepția faptului că rezultatul este BCF necomprimat, adică
preferat pentru conducte.

Opţiuni pentru Genotip Probabilitate Calcul (Pentru -g or -u):

-e INT Probabilitatea de eroare de secvențiere a extensiei decalajului la scară Phred. Reduce INT
duce la indeluri mai lungi. [20]

-h INT Coeficient pentru modelarea erorilor de homopolimer. Având în vedere o l-lung
homopolimer run, eroarea de secvențiere a unui indel de dimensiune s este modelat
as INT*s/l. [100]

-I Nu efectuați apeluri INEL

-L INT Omiteți apelurile INDEL dacă adâncimea medie per eșantion este peste INT.
[250]

-o INT Probabilitatea de eroare de secvențiere deschisă la scară Phred. Reduce INT conduce
la mai multe apeluri indel. [40]

-p Aplicați pragurile -m și -F pe probă pentru a crește sensibilitatea
chemând. În mod implicit, ambele opțiuni sunt aplicate citirilor grupate din toate
probe.

-P STR Lista de platforme delimitată prin virgulă (determinată de @RG-PL) de la care
se obţin candidaţi indel. Se recomandă colectarea indel
candidați din tehnologiile de secvențiere care au o rată de eroare indel scăzută
precum ILLUMINA. [toate]

reheader samtools reheader

Înlocuiți antetul în.bam cu antetul înăuntru in.header.sam. Această comandă este
mult mai rapid decât înlocuirea antetului cu o conversie BAM->SAM->BAM.

pisică samtools cat [-h header.sam] [-o out.bam] [...]

Concatenați BAM-uri. Dicționarul de secvență al fiecărei BAM de intrare trebuie să fie identic,
deși această comandă nu verifică acest lucru. Această comandă folosește un truc similar cu
reheader care permite concatenarea BAM rapidă.

fel samtools sort [-nof] [-m maxMem]

Sortați aliniamentele după coordonatele cele mai din stânga. Fişier .bam va fi creat.
Această comandă poate crea și fișiere temporare .%d.bam când întregul
alinierea nu poate fi introdusă în memorie (controlată de opțiunea -m).

OPȚIUNI:

-o Ieșiți alinierea finală la ieșirea standard.

-n Sortați după numele citite și nu după coordonatele cromozomiale

-f Utilizare ca cale de ieșire completă și nu adăugați .bam sufix.

-m INT Aproximativ memoria maximă necesară. [500000000]

îmbina samtools merge [-nur1f] [-h inh.sam] [-R reg]
[...]

Îmbinați mai multe aliniamente sortate. Listele de referință din antet ale tuturor intrărilor
Fișierele BAM și antetele @SQ ale inh.sam, dacă există, toate trebuie să se refere la același
set de secvențe de referință. Lista de referințe antet și (dacă nu este suprascris de
-h) Anteturile „@” ale in1.bam va fi copiat în afară.bam, și anteturile altora
fișierele vor fi ignorate.

OPȚIUNI:

-1 Utilizați nivelul de compresie zlib 1 pentru a cuprinde rezultatul

-f Forțați să suprascrieți fișierul de ieșire, dacă este prezent.

-h FILE Utilizați liniile de FILE ca antete „@” în care să fie copiate afară.bam, înlocuind
orice linii de antet din care altfel ar fi copiate in1.bam. (FILE is
de fapt în format SAM, deși orice înregistrări de aliniere pe care le poate conține sunt
ignorat.)

-n Aliniamentele de intrare sunt sortate după nume citite mai degrabă decât după cromozomiale
coordonatele

-R STR Îmbinați fișierele în regiunea specificată indicată de STR [nul]

-r Atașați o etichetă RG la fiecare aliniere. Valoarea etichetei este dedusă din fișier
nume.

-u Ieșire BAM necomprimată

index index samtools

Aliniere sortată index pentru acces rapid aleatoriu. Fișier index .bai va fi
creat.

idxstats samtools idxstats

Preluați și imprimați statistici în fișierul index. Ieșirea este delimitată cu TAB
fiecare linie constând din numele secvenței de referință, lungimea secvenței, # citiri mapate
și # de citiri nemapate.

faidx samtools faidx [regiune1 [...]]

Indexați secvența de referință în format FASTA sau extrageți secvența din indexat
secvență de referință. Dacă nu este specificată nicio regiune, faidx va indexa fișierul și
crea .fai pe disc. Dacă sunt specificate regiuni, subsecvențele
va fi preluat și imprimat în stdout în format FASTA. Fișierul de intrare poate
fi comprimat în RAZF format.

fixmate samtools fixmate

Completați coordonatele de împerechere, ISIZE și steaguri legate de împerechere dintr-un nume sortat
aliniere.

rmdup samtools rmdup [-sS]

Eliminați potențialele duplicate PCR: dacă mai multe perechi de citire au externe identice
coordonate, păstrați doar perechea cu cea mai înaltă calitate a cartografierii. În pereche-
modul final, această comandă NUMAI funcționează cu orientare FR și necesită ISIZE este
setat corect. Nu funcționează pentru citirile nepereche (de exemplu, două capete mapate la
cromozomi diferiți sau citiri orfane).

OPȚIUNI:

-s Eliminați duplicatul pentru citirile cu un singur capăt. În mod implicit, comanda funcționează pentru
Numai citiri asociate.

-S Tratați citirile cu sfârșit pereche și citirile cu un singur capăt.

calm samtools calmd [-EeubSr] [-C capQcoef]

Generați eticheta MD. Dacă eticheta MD este deja prezentă, această comandă va da a
avertisment dacă eticheta MD generată este diferită de eticheta existentă. Ieșire SAM
în mod implicit.

OPȚIUNI:

-A Când este utilizat împreună cu -r această opțiune suprascrie baza originală
calitate.

-e Convertiți o bază de citire în = dacă este identică cu referința aliniată
baza. Apelantul Indel nu acceptă bazele = momentan.

-u Ieșire BAM necomprimat

-b Ieșire BAM comprimat

-S Intrarea este SAM cu linii de antet

-C INT Coeficientul pentru a limita calitatea cartografierii citirilor mapate slab. Vezi
acumulare comanda pentru detalii. [0]

-r Calculați eticheta BQ (fără -A) sau calitatea de bază a capacului după BAQ (cu -A).

-E Calcul BAQ extins. Această opțiune schimbă specificitatea pentru
sensibilitate, deși efectul este minor.

targetcut samtools targetcut [-Q minBaseQ] [-i inPenalty] [-0 em0] [-1 em1] [-2 em2] [-f
ref]

Această comandă identifică regiunile țintă examinând continuitatea citirii
adâncime, calculează secvențe consens haploide ale țintelor și emite un SAM cu
fiecare secvenţă corespunzând unei ţinte. Când opțiunea -f este în uz, BAQ va fi
aplicat. Această comandă este afară conceput pentru tăierea clonelor fosmide din fosmid
secvențierea piscinei [Ref. Kitzman şi colab. (2010)].

fază fază samtools [-AF] [-k len] [-b prefix] [-q minLOD] [-Q minBaseQ]

Apelați și fazați SNP-uri heterozigote. OPȚIUNI:

-A Aruncă citirile cu faza ambiguă.

-b STR Prefixul ieșirii BAM. Când această opțiune este în uz, citirile de fază 0 vor fi
salvate în fișier STR.0.bam și faza-1 citește STR.1.bam. Faza necunoscuta
citirile vor fi alocate aleatoriu unuia dintre cele două fișiere. Citește himeric
cu erori de comutare vor fi salvate în STR.himeric.bam. [nul]

-F Nu încercați să remediați citirile himerice.

-k INT Lungime maximă pentru fazare locală. [13]

-q INT LOD minim la scară Phred pentru a numi un heterozigot. [40]

-Q INT Calitatea de bază minimă pentru a fi utilizată în apelurile het. [13]

BCFTOOLS COMANDE AND OPŢIUNI


Vizualizează bcftools Vizualizează [-AbFGNQSucgv] [-D secvDict] [-l listLoci] [-s listSample] [-i
gapSNPratio] [-t mutRate] [-p varThres] [-m varThres] [-P anterior] [-1 nGrupul 1]
[-d minFrac] [-U nPerm] [-X permThres] [-T trioType] în.bcf [regiune]

Convertiți între BCF și VCF, apelați candidații variante și estimați alela
frecvențe.

Intrare ieșire Opțiuni:

-A Păstrați toate alelele alternative posibile la locurile variante. În mod implicit,
comanda view elimină alele improbabile.

-b Ieșire în format BCF. Valoarea implicită este VCF.

-D FILE Dicționar de secvență (lista de nume de cromozomi) pentru conversia VCF->BCF
[nul]

-F Indicați că PL este generat de r921 sau înainte (comanda este diferită).

-G Suprimați toate informațiile despre genotipul individual.

-l FILE Lista site-urilor la care sunt transmise informații [toate site-urile]

-N Omite site-urile unde câmpul REF nu este A/C/G/T

-Q Ieșiți formatul de probabilitate QCALL

-s FILE Lista de mostre de utilizat. Prima coloană din intrare oferă eșantionul
nume iar al doilea dă ploidia, care nu poate fi decât 1 sau 2. Când
coloana a 2-a este absentă, ploidia eșantionului se presupune a fi 2. În
ieșire, ordonarea mostrelor va fi identică cu cea din FILE.
[nul]

-S Intrarea este VCF în loc de BCF.

-u Ieșire BCF necomprimată (forța -b).

Consens/Varianta apel Opțiuni:

-c Apelați variante folosind inferența bayesiană. Această opțiune automat
invocă opțiunea -e.

-d PLUTI Cand -v este în uz, săriți peste locurile în care fracțiunea de probe acoperită de
citește este sub FLOAT. [0]

-e Efectuați numai inferențe cu probabilitatea maximă, inclusiv estimarea site-ului
frecvența alelelor, testarea echilibrului Hardy-Weinberg și testarea
asocieri cu LRT.

-g Apelarea genotipurilor per eșantion la site-urile variante (forța -c)

-i PLUTI Raportul dintre rata mutației INDEL la SNP [0.15]

-m PLUTI Model nou pentru apeluri multialelice și variante rare îmbunătățite. O alta
Alela ALT este acceptată dacă P(chi^2) LRT depășește pragul FLOAT.
Parametrul pare robust, iar valoarea reală, de obicei, nu
afectează mult rezultatele; o valoare bună de utilizat este 0.99. Acesta este
metoda de apelare recomandată. [0]

-p PLUTI Un site este considerat a fi o variantă dacă P(ref|D)

-P STR Spectrul de frecvență alelelor anterior sau inițial. Dacă STR poate fi Complet, starea2,
plat sau fișierul constând din ieșirea de eroare dintr-o variantă anterioară
chemând alerga.

-t PLUTI Rata de mutare la scară pentru apelarea variantei [0.001]

-T STR Activați apelul pereche/trio. Pentru apeluri trio, opțiune -s este de obicei
trebuiau aplicate pentru a configura membrii trio-ului și ordonarea acestora.
În fișierul furnizat opțiunii -s, prima mostră trebuie să fie
copilul, al doilea tatăl și al treilea mama. Valabilul
valori ale STR sunt „pereche”, „trioauto”, „trioxd” și „trioxs”, unde
`pair' apelează diferențele dintre două mostre de intrare și `trioxd'
(`trioxs') specifică faptul că intrarea este de la cromozomul X non-PAR
regiuni iar copilul este o femeie (mascul). [nul]

-v Numai site-uri variante de ieșire (forța -c)

Contrast apel și Asociație Test Opțiuni:

-1 INT Numărul de eșantioane din grupa 1. Această opțiune este folosită pentru împărțirea
probe în două grupuri pentru apelarea SNP de contrast sau testul de asociere.
Când această opțiune este în uz, vor fi afișate următoarele INFO VCF:
PC2, PCHI2 și QCHI2. [0]

-U INT Numărul de permutări pentru testul de asociere (eficient numai cu -1)
[0]

-X PLUTI Efectuați doar permutări pentru P(chi^2) -U)
[0.01]

index bcftools index în.bcf

BCF sortat index pentru acces aleatoriu.

pisică bcftools pisică în1.bcf [în2.bcf [...]]]

Concatenați fișierele BCF. Fișierele de intrare trebuie să fie sortate și să aibă
mostre identice care apar în aceeași ordine.

SAM FORMAT


Formatul Sequence Alignment/Map (SAM) este delimitat de TAB. În afară de liniile de antet, care
sunt începute cu simbolul „@”, fiecare linie de aliniere constă din:

┌────┬───────┬──────────────────────────────────── ──────────────────────┐
Fes / fularCâmpDescriere
├────┼───────┼──────────────────────────────────── ──────────────────────┤
│ 1 │ QNAME │ Șablon de interogare/pereche NAME │
│ 2 │ STRAPUL │ STRAPUL pe biți │
│ 3 │ RNAME │ Secvență de referință NUME │
│ 4 │ POS │ 1 bazată pe XNUMX poziție cea mai din stânga/coordonată a secvenței tăiate │
│ 5 │ MAPQ │ Calitatea mapării (la scară Phred) │
│ 6 │ CIAGR │ șir de trabuc extins │
│ 7 │ MRNM │ Mate Secvență de referință NaMe (`=' dacă este același cu RNAME) │
│ 8 │ MPOS │ Poziție Mate bazată pe 1 │
│ 9 │ TLEN │ Lungimea șablonului dedusă (dimensiunea inserării) │
│10 │ SEQ │ interogare SECVENTE pe aceeași catenă ca și referința │
│11 │ QUAL │ interogare QUALity (ASCII-33 oferă calitatea de bază Phred) │
│12+ │ OPT │ variabile Câmpuri OPȚIONALE în formatul TAG:VTYPE:VALUE │
└────┴───────┴──────────────────────────────────── ──────────────────────┘

Fiecare bit din câmpul FLAG este definit ca:

┌───────┬─────┬─────────────────────────────────── ───────────────┐
PavilionchrDescriere
├───────┼─────┼─────────────────────────────────── ───────────────┤
│0x0001 │ p │ citirea este împerecheată în secvenție │
│0x0002 │ P │ citirea este mapată într-o pereche adecvată │
│0x0004 │ u │ secvența de interogare în sine este nemapată │
│0x0008 │ U │ perechea este nemapată │
│0x0010 │ r │ componenta interogării (1 pentru revers) │
│0x0020 │ R │ firul partenerului │
│0x0040 │ 1 │ citirea este prima citire dintr-o pereche │
│0x0080 │ 2 │ citirea este a doua citire dintr-o pereche │
│0x0100 │ s │ alinierea nu este primară │
│0x0200 │ f │ verificarea calității platformei/furnizorului eșuează citirea │
│0x0400 │ d │ citirea este fie o PCR, fie un duplicat optic │
└───────┴─────┴─────────────────────────────────── ───────────────┘
unde a doua coloană oferă reprezentarea în șir a câmpului FLAG.

TU F FORMAT


Variant Call Format (VCF) este un format delimitat de TAB din care constă fiecare linie de date
următoarele câmpuri:

┌────┬────────┬─────────────────────────────────── ───────────────────────────┐
Fes / fularCâmpDescriere
├────┼────────┼─────────────────────────────────── ───────────────────────────┤
│ 1 │ CROM │ Nume cromozom │
│ 2 │ POS │ poziția cea mai din stânga a variantei │
│ 3 │ ID │ unic varianta IDentifier │
│ 4 │ REF │ alela REFERENCE │
│ 5 │ ALT │ alelele alternative, separate prin virgulă │
│ 6 │ QUAL │ varianta/referință QUALity │
│ 7 │ FILTRE │ Filtre aplicate │
│ 8 │ INFO │ INFORMAȚII aferente variantei, separate prin punct și virgulă │
│ 9 │ FORMAT │ FORMAT al câmpurilor genotipului, separate prin două puncte (opțional) │
│10+ │ PROBA │ genotipuri SAMPLE și informații per eșantion (opțional) │
└────┴────────┴─────────────────────────────────── ───────────────────────────┘

Următorul tabel oferă Informație etichete utilizate de samtools și bcftools.

┌──────┬───────────┬────────────────────────────── ────────────────────────────────────────────────── ────────────────────┐
EtichetăFormatDescriere
├──────┼───────────┼────────────────────────────── ────────────────────────────────────────────────── ────────────────────┤
└──────┴───────────┴────────────────────────────── ────────────────────────────────────────────────── ────────────────────┘

EXEMPLE


o Import SAM în BAM când @SQ liniile sunt prezente în antet:

samtools view -bS aln.sam > aln.bam

If @SQ liniile sunt absente:

samtools faidx ref.fa
samtools view -bt ref.fa.fai aln.sam > aln.bam

Unde ref.fa.fai este generat automat de către faidx comanda.

o Atașați RG etichetați în timpul îmbinării aliniamentelor sortate:

perl -e 'print
„@RG\tID:ga\tSM:hs\tLB:ga\tPL:Illumina\n@RG\tID:454\tSM:hs\tLB:454\tPL:454\n"' > rg.txt
samtools merge -rh rg.txt merged.bam ga.bam 454.bam

Valoarea în a RG eticheta este determinată de numele fișierului din care provine citirea. In acest
exemplu, în fuzionat.bam, se citește din ga.bam va fi atașat RG:Z:ga, în timp ce citește din
454.bam va fi atașat RG:Z:454.

o Apelați SNP-uri și INDEL scurte pentru un individ diploid:

samtools mpileup -ugf ref.fa aln.bam | bcftools vizualizare -bvcg - > var.raw.bcf
bcftools vizualizare var.raw.bcf | vcfutils.pl varFilter -D 100 > var.flt.vcf

-D opțiunea varFilter controlează adâncimea maximă de citire, la care ar trebui ajustată
aproximativ de două ori adâncimea medie de citire. Se poate lua în considerare să adauge -C50 la empileup dacă cartografiază
calitatea este supraestimată pentru citirile care conțin nepotriviri excesive. Aplicând această opțiune
de obicei ajută BWA-scurt dar poate nu și alți cartografi.

o Generați secvența de consens pentru un individ diploid:

samtools mpileup -uf ref.fa aln.bam | bcftools vizualizare -cg - | vcfutils.pl vcf2fq >
cns.fq

o Numiți mutații somatice dintr-o pereche de eșantioane:

samtools mpileup -DSuf ref.fa aln.bam | bcftools vizualizare -bvcgT pereche -> var.bcf

În câmpul INFO de ieșire, CRJ oferă raportul Phred-log dintre probabilitatea de
tratarea celor două probe în mod independent și probabilitatea prin solicitarea genotipului
fi identic. Acest CRJ este efectiv un scor care măsoară încrederea somaticului
apeluri. Cu cât mai mare, cu atât mai bine.

o Apel de novo și mutații somatice dintr-un trio de familie:

samtools mpileup -DSuf ref.fa aln.bam | bcftools vizualizare -bvcgT pereche -s samples.txt - >
var.bcf

Fișier mostre.txt ar trebui să fie format din trei rânduri care specifică membrul și ordinea
mostre (în ordinea copil-tată-mamă). În mod similar, CRJ dă Phred-log
raportul de probabilitate cu și fără constrângerea trio. CGU arată cel mai probabil
configurația genotipului fără constrângerea trio și CGT dă cel mai probabil
configurația genotipului care satisface constrângerea trio.

o Faza XNUMX individ:

samtools calmd -AEur aln.bam ref.fa | samtools phase -b prefix - > phase.out

calm comanda este folosită pentru a reduce heterozigoții falși din jurul INDEL-urilor.

o Apelați SNP-uri și indeluri scurte pentru mai mulți indivizi diploizi:

samtools mpileup -P ILLUMINA -ugf ref.fa *.bam | bcftools vizualizare -bcvg - > var.raw.bcf
bcftools vizualizare var.raw.bcf | vcfutils.pl varFilter -D 2000 > var.flt.vcf

Persoanele fizice sunt identificate din SM etichete în @RG linii de antet. Indivizii pot fi
grupate într-un singur fișier de aliniere; un individ poate fi, de asemenea, separat în mai multe fișiere.
-P opțiunea specifică faptul că candidații indel trebuie colectați numai din grupurile de citire
cu @RG-PL eticheta setată la Illumina. Colectarea candidaților indel din citirile secvențiate
printr-o tehnologie predispusă la indel poate afecta performanța apelării indel.

Rețineți că există un nou model de apelare care poate fi invocat de

vizualizare bcftools -m0.99 ...

care fixează unele limitări severe ale metodei implicite.

Pentru filtrare, cele mai bune rezultate par să fie obținute prin aplicarea mai întâi a SnpGap filtru si
apoi aplicând o abordare de învățare automată

vcf-annotate -f SnpGap=n
filtru vcf...

Ambele pot fi găsite în vcftools și htslib pachet (link-uri de mai jos).

o Deduceți spectrul de frecvență alelelor (AFS) dintr-o listă de site-uri de la mai mulți indivizi:

samtools mpileup -Igf ref.fa *.bam > all.bcf
bcftools vizualizare -bl site-uri.list all.bcf > site-uri.bcf
bcftools vizualizare -cGP cond2 site-uri.bcf > /dev/null 2> site-uri.1.afs
bcftools vizualizare -cGP site-uri.1.afs site-uri.bcf > /dev/null 2> site-uri.2.afs
bcftools vizualizare -cGP site-uri.2.afs site-uri.bcf > /dev/null 2> site-uri.3.afs
......

Unde site-uri.listă conține lista de site-uri cu fiecare linie constând din referință
numele şi poziţia secvenţei. Următoarele bcftools comenzile estimează AFS prin EM.

o Dump BAQ aplicat alinierea pentru alți apelanți SNP:

samtools calmd -bAr aln.bam > aln.baq.bam

Acesta adaugă și corectează NM și MD etichete în același timp. The calm vine si comanda
cu -C opțiunea, aceeași cu cea din acumulare și empileup. Aplicați dacă vă ajută.

LIMITAREA


o Cuvinte nealiniate utilizate în bam_import.c, bam_endian.h, bam.c și bam_aux.c.

o Samtools paired-end rmdup nu funcționează pentru citiri nepereche (de exemplu, citiri orfane sau se încheie
mapate pe diferiți cromozomi). Dacă aceasta este o problemă, vă rugăm să utilizați Picard's
MarkDuplicate care gestionează corect aceste cazuri, deși puțin mai lent.

Utilizați bcftools online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

  • 1
    Firebird
    Firebird
    Firebird RDBMS oferă caracteristici ANSI SQL
    și rulează pe Linux, Windows și
    mai multe platforme Unix. Caracteristici
    concurență și performanță excelente
    & putere...
    Descărcați Firebird
  • 2
    KompoZer
    KompoZer
    KompoZer este un editor HTML wysiwyg care utilizează
    baza de cod Mozilla Composer. La fel de
    Dezvoltarea Nvu a fost oprită
    în 2005, KompoZer remediază multe erori și
    adaugă un f...
    Descărcați KompoZer
  • 3
    Descărcător gratuit de manga
    Descărcător gratuit de manga
    Free Manga Downloader (FMD) este un
    aplicație open source scrisă în
    Object-Pascal pentru gestionarea și
    descărcarea manga de pe diverse site-uri web.
    Aceasta este o oglindă...
    Descărcați gratuit Manga Downloader
  • 4
    UNetbootin
    UNetbootin
    UNetbootin vă permite să creați bootable
    Unități USB live pentru Ubuntu, Fedora și
    alte distribuții Linux fără
    arderea unui CD. Se rulează pe Windows, Linux,
    şi ...
    Descărcați UNetbootin
  • 5
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM este ușor de utilizat
    Pachetul software ERP și CRM open source
    (rulați cu un server web php sau ca
    software autonom) pentru companii,
    fundatii...
    Descărcați Dolibarr ERP - CRM
  • 6
    Client SQL SQuirreL
    Client SQL SQuirreL
    SQuirreL SQL Client este un SQL grafic
    client scris în Java care va permite
    pentru a vizualiza structura unui JDBC
    baza de date conformă, răsfoiți datele în
    Mese...
    Descărcați SQuirreL SQL Client
  • Mai mult »

Comenzi Linux

Ad