EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

vcftools - Online în cloud

Rulați vcftools în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda vcftools care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


vcftools - analizează fișierele VCF

REZUMAT


vcftools [OPŢIUNI]

DESCRIERE


Programul vcftools este rulat din linia de comandă. Interfața este inspirată de PLINK și
deci ar trebui să fie în mare măsură familiară utilizatorilor acelui pachet. Comenzile iau următoarea formă:

vcftools --vcf file1.vcf --chr 20 --freq

Comanda de mai sus îi spune vcftools să citească în fișierul file1.vcf, să extragă site-urile pe
cromozomul 20 și calculați frecvența alelelor la fiecare loc. Alela rezultată
estimările de frecvență sunt stocate în fișierul de ieșire, out.freq. Ca și în exemplul de mai sus,
ieșirea de la vcftools este trimisă în principal la fișierele de ieșire, spre deosebire de a fi afișată pe fișierul
ecran.

Rețineți că unele comenzi pot fi disponibile numai în cea mai recentă versiune de vcftools. A obtine
cea mai recentă versiune, ar trebui să utilizați SVN pentru a verifica cel mai recent cod, așa cum este descris pe
pagina de acasă.

De asemenea, rețineți că genotipurile poliploide nu sunt acceptate în prezent.

pachet de bază Opţiuni
--vcf
Această opțiune definește fișierul VCF care urmează să fie procesat. Fișierele trebuie decomprimate
înainte de utilizare cu vcftools. vcftools așteaptă fișiere în format VCF v4.0, a
ale căror specificații pot fi găsite aici.

--gzvcf
Această opțiune poate fi folosită în locul opțiunii --vcf pentru a citi comprimat (gzipped)
Fișierele VCF direct. Rețineți că această opțiune poate fi destul de lentă atunci când este utilizată cu mari dimensiuni
fișiere.

--afara
Această opțiune definește prefixul numelui fișierului de ieșire pentru toate fișierele generate de vcftools.
De exemplu, dacă este setat la output_filename, atunci toate fișierele de ieșire vor fi
de forma output_filename.*** . Dacă această opțiune este omisă, toate fișierele de ieșire vor fi
au prefixul 'out.'.

teren Filtru Opţiuni
--chr
Procesează numai site-urile cu o potrivire a identificatorului cromozomului

--din-bp

--la-bp
Aceste opțiuni definesc intervalul fizic de site-uri care vor fi procesate. Site-uri din exterior
din acest interval vor fi excluse. Aceste opțiuni pot fi utilizate numai împreună cu
--chr.

--snp
Includeți SNP(-uri) cu ID-ul potrivit. Această comandă poate fi folosită de mai multe ori în ordine
pentru a include mai mult de un SNP.

--snps
Includeți o listă de SNP-uri date într-un fișier. Fișierul ar trebui să conțină o listă de ID-uri SNP,
cu un ID pe linie.

--exclude
Excludeți o listă de SNP-uri date într-un fișier. Fișierul ar trebui să conțină o listă de ID-uri SNP,
cu un ID pe linie.

--pozitii
Includeți un set de site-uri pe baza unei liste de poziții. Fiecare linie de intrare
fișierul ar trebui să conțină un cromozom (separat prin tabulatori) și o poziție. Dosarul ar trebui
au o linie de antet. Site-urile care nu sunt incluse în listă sunt excluse.

--pat

--exclude-pat
Includeți sau excludeți un set de site-uri pe baza unui fișier BED. Doar primele trei
sunt necesare coloane (chrom, chromStart și chromEnd). Fișierul BED ar trebui să aibă un
linia de antet.

--elimină-filtrate-toate

--elimină-filtrat

--a păstra-filtrat
Aceste opțiuni sunt folosite pentru a filtra site-urile pe baza flagului FILTER. The
prima opțiune elimină toate site-urile cu un flag FILTER. A doua opțiune poate fi folosită
excludeți site-urile cu un semnal de filtru specific. A treia opțiune poate fi folosită pentru a selecta
site-uri pe baza unor semnale de filtrare specifice. A doua și a treia opțiune pot fi
folosit de mai multe ori pentru a specifica mai multe FILTRE. Opțiunea --keep-filtered este
aplicat înaintea opțiunii --remove-filtered.

--minQ
Includeți numai site-urile cu o calitate peste acest prag.

--min-meanDP

--max-meanDP
Includeți site-uri cu adâncime medie în pragurile definite de aceste opțiuni.

--maf

--max-maf
Includeți numai site-uri cu frecvență alelelor minore în intervalul specificat.

--non-ref-af

--max-non-ref-af
Includeți numai site-uri cu frecvență alelelor fără referință în intervalul specificat.

--nuanţă
Evaluează locațiile pentru echilibrul Hardy-Weinberg folosind un test exact, așa cum este definit de
Wigginton, Cutler și Abecasis (2005). Site-uri cu o valoare p sub prag
definite de această opțiune sunt considerate ca fiind în afara HWE și, prin urmare, excluse.

--geno
Excludeți site-urile pe baza proporției de date lipsă (definită ca fiind între
0 și 1).

--min-alele

--max-alele
Includeți numai site-uri cu un număr de alele în intervalul specificat. Pentru
de exemplu, pentru a include numai site-uri bi-alelice, s-ar putea folosi:

vcftools --vcf file1.vcf --min-alleles 2 --max-aleles 2

--masca

--invers-mască

--mască-min
Includeți site-uri pe baza unui fișier asemănător FASTA. Fișierul furnizat conține a
succesiune de cifre întregi (între 0 și 9) pentru fiecare poziție pe un cromozom care
specificați dacă un site din acea poziție trebuie filtrat sau nu. Un exemplu de fișier de mască
ar arata ca:

>1
0000011111222 ...

În acest exemplu, site-urile din fișierul VCF situate în primele 5 baze ale
începutul cromozomului 1 ar fi păstrat, în timp ce locurile de la poziția 6 în continuare ar fi
filtrat. Pragul întreg care determină dacă site-urile sunt filtrate sau nu este
setați folosind opțiunea --mask-min, care este implicit 0. Cromozomii conținuti în
fișierul masca trebuie sortat în aceeași ordine ca fișierul VCF. Opțiunea --mask
este folosit pentru a specifica fișierul masca care trebuie utilizat, în timp ce opțiunea --invert-mask poate
poate fi folosit pentru a specifica un fișier de mască care va fi inversat înainte de a fi aplicat.

Individual Filtre
--indv
Specificați o persoană care urmează să fie păstrată în analiză. Această opțiune poate fi utilizată de mai multe ori
ori pentru a specifica mai multe persoane.

--a pastra
Furnizați un fișier care să conțină o listă de persoane care să fie incluse într-o analiză ulterioară.
Fiecare ID individual (așa cum este definit în antetul VCF) ar trebui inclus pe a
linie separată.

--remove-indv
Specificați o persoană care urmează să fie eliminată din analiză. Această opțiune poate fi folosită
de mai multe ori pentru a specifica mai multe persoane. Dacă și opțiunea --indv este
specificat, apoi opțiunea --indv este executată înaintea opțiunii --remove-indv.

--elimina
Furnizați un fișier care conține o listă de persoane pe care să le excludeți în analiza ulterioară.
Fiecare ID individual (așa cum este definit în antetul VCF) ar trebui inclus pe a
linie separată. Dacă sunt folosite atât opțiunile --keep, cât și --remove, atunci
Opțiunea --keep este executată înaintea opțiunii --remove.

--mon-indv-meanDP

--max-indv-meanDP
Calculați acoperirea medie pe o bază individuală. Doar indivizi cu
acoperirea în intervalul specificat de aceste opțiuni sunt incluse în următoarele
analize.

--minte
Specificați pragul minim al ratei de apel pentru fiecare persoană.

--pe etape
Mai întâi exclude toți indivizii care au toate genotipurile nefazate și, ulterior
exclude toate situsurile cu genotipuri nefazate. Datele rămase constau prin urmare
numai de date în etape.

Genotip Filtre
--remove-filtrate-geno-all

--remove-filtered-geno
Prima opțiune elimină toate genotipurile cu un flag FILTER. A doua varianta poate fi
folosit pentru a exclude genotipurile cu un indicator de filtru specific.

--minGQ
Excludeți toate genotipurile cu o calitate sub pragul specificat de această opțiune
(GQ).

--minDP
Excludeți toate genotipurile cu o adâncime de secvențiere sub cea specificată de această opțiune
(DP)

producție Statistici
--frecventa

--contează

--frecventa2

--contează2
Ieșire informații de frecvență per site. --freq scoate frecvența alelei în a
fișier cu sufixul „.frq”. Opțiunea --counts scoate un fișier similar cu fișierul
sufixul „.frq.count”, care conține numărul de alele brute la fiecare site. Frecvența --2
și opțiunile --count2 sunt folosite pentru a suprima informațiile alelelor din fișierul de ieșire. În
în acest caz, ordinea frecvenţelor/numărărilor depinde de numerotarea din fişierul VCF.

--adâncime
Generează un fișier care conține adâncimea medie per individ. Acest fișier are sufixul
'.profunzime'.

--adâncimea-situl

--situl-medie-adâncime
Generează un fișier care conține adâncimea pe site. Opțiunea --site-depth emite fișierul
adâncimea pentru fiecare sit însumată pe indivizi. Acest fișier are sufixul „.ldepth”.
De asemenea, --site-mean-depth scoate în evidență adâncimea medie pentru fiecare site și
fișierul de ieșire are sufixul „.ldepth.mean”.

--geno-adâncime
Generează un fișier (posibil foarte mare) care conține adâncimea fiecărui genotip în
fișierul VCF. Intrările lipsă primesc valoarea -1. Fișierul are sufixul
'.gdepth'.

--calitatea site-ului
Generează un fișier care conține calitatea SNP per site, așa cum se găsește în coloana QUAL
din fișierul VCF. Acest fișier are sufixul „.lqual”.

--het Calculează o măsură a heterozigozității pe o bază individuală. Mai exact, cel
coeficientul de consangvinizare, F, este estimat pentru fiecare individ folosind o metodă de
momente. Fișierul rezultat are sufixul „.het”.

--rezistent
Raportează o valoare p pentru fiecare loc dintr-un test de echilibru Hardy-Weinberg (așa cum este definit
de Wigginton, Cutler și Abecasis (2005)). Fișierul rezultat (cu sufixul „.hwe”)
conține, de asemenea, numerele observate de homozigoți și heterozigoți și
numerele așteptate corespunzătoare sub HWE.

--dispărut
Generează două fișiere care raportează lipsa pe o persoană și pe site
bază. Cele două fișiere au sufixe „.imiss” și, respectiv, „.lmiss”.

--hap-r2

--geno-r2

--ld-window

--ld-window-bp

--min-r2
Aceste opțiuni sunt utilizate pentru a raporta statisticile legate de dezechilibru (LD) ca
rezumat prin statistica r2. Opțiunea --hap-r2 informează vcftools să iasă a
fișier care raportează statistica r2 folosind haplotipuri în faze. Acesta este tradiționalul
măsurarea LD adesea raportată în literatura de genetică a populației. Dacă este în faze
haplotipurile nu sunt disponibile, atunci poate fi utilizată opțiunea --geno-r2, care calculează
coeficientul de corelație pătrat între genotipurile codificate ca 0, 1 și 2 la
reprezintă numărul de alele de non-referință la fiecare individ. Asta e lafel
ca măsură LD raportată de PLINK. Versiunea haplotip produce un fișier cu
sufixul „.hap.ld”, în timp ce versiunea genotipului scoate un fișier cu sufixul
'.geno.ld'. Versiunea haplotip implică opțiunea --phased.

Opțiunea --ld-window definește separarea SNP maximă pentru calculul
LD. De asemenea, opțiunea --ld-window-bp poate fi utilizată pentru a defini maximul fizic
separarea SNP-urilor incluse în calculul LD. În cele din urmă, --min-r2 stabilește a
valoare minimă pentru r2 sub care statistica LD nu este raportată.

--SNPdnsity
Calculează numărul și densitatea SNP-urilor în containere de dimensiune definită de această opțiune.
Fișierul rezultat are sufixul „.snpden”.

--TsTv
Calculează raportul de tranziție/transversie în containere cu dimensiunea definită de aceasta
opțiune. Fișierul rezultat are sufixul „.TsTv”. Un rezumat este, de asemenea
furnizat într-un fișier cu sufixul „.TsTv.summary”.

--FILTRE-rezumat
Generează un rezumat al numărului de SNP și al raportului Ts/Tv pentru fiecare categorie de FILTRE.
Fișierul de ieșire are sufixul „.FILTER.summary.

--site-uri filtrate
Creează două fișiere care listează site-uri care au fost păstrate sau eliminate după filtrare. The
primul fișier, cu sufixul „.kept.sites”, listează site-urile păstrate de vcftools după filtre
au fost aplicate. Al doilea fișier, cu sufixul „.removed.sites”, listează site-urile
eliminate de filtrele aplicate.

--singletons
Această opțiune va genera un fișier care detaliază locația singleton-urilor și
individul în care apar. Fișierul raportează atât adevărate singletons, cât și private
dubleton (adică SNP-uri în care alela minoră apare doar la un singur individ și
acel individ este homozigot pentru alela respectivă). Fișierul de ieșire are sufixul
'.singletons'.

--site-pi

--window-pi
Aceste opțiuni sunt utilizate pentru a estima nivelurile diversității nucleotidelor. Prima varianta
face acest lucru pe bază de site, iar fișierul de ieșire are sufixul „.sites.pi”. The
a doua opțiune calculează diversitatea nucleotidelor în ferestre, cu dimensiunea ferestrei
definite în argumentul opțiunii. Ieșirea pentru această opțiune are sufixul
'.ferestre.pi'. Versiunea cu ferestre necesită date în faze și, prin urmare, utilizarea acestora
opțiunea implică opțiunea --phased.

producție in Altele Formate
--O12 Această opțiune scoate genotipurile ca o matrice mare. Sunt produse trei fișiere. The
mai întâi, cu sufixul „.012”, conține genotipurile fiecărui individ separat
linia. Genotipurile sunt reprezentate ca 0, 1 și 2, unde numărul reprezintă asta
numărul de alele de non-referință. Genotipurile lipsă sunt reprezentate de -1. The
al doilea fișier, cu sufixul „.012.indv” detaliază persoanele incluse în principal
fişier. Al treilea fișier, cu sufixul „.012.pos” detaliază locațiile site-ului în care sunt incluse
fisierul principal.

--IMPUTARE
Această opțiune generează haplotipuri în faze în format de panou de referință IMPUTE. Ca IMPUT
necesită date în etape, utilizarea acestei opțiuni implică și --phased. Nefazat
indivizii și genotipurile sunt deci excluse. Numai site-urile bi-alelice sunt
incluse în ieșire. Utilizarea acestei opțiuni generează trei fișiere. IMPUTUL
fișierul haplotip are sufixul „.impute.hap”, iar fișierul legendă IMPUTE are
sufixul „.impute.hap.legendă”. Al treilea fișier, cu sufixul „.impute.hap.indv”,
detaliază persoanele incluse în fișierul haplotip, deși acest fișier nu este
necesare de IMPUTE.

--ldhat

--ldhat-geno
Aceste opțiuni scot date în format LDhat. Utilizarea acestor opțiuni necesită și
--chr opțiunea de utilizat. Opțiunea --ldhat scoate numai date în faze și, prin urmare
implică, de asemenea, --fazat, ceea ce duce la existența unor indivizi și genotipuri nefazate
exclus. Alternativ, opțiunea --ldhat-geno tratează toate datele ca
nefazat și, prin urmare, scoate fișiere LDhat în format genotip/nefazat. În oricare
caz, două fișiere sunt generate cu sufixele „.ldhat.sites” și „.ldhat.locs”,
care corespund fișierelor de intrare LDhat „site-uri” și, respectiv, „locs”.

--BEAGLE-GL
Această opțiune emite informații despre probabilitatea genotipului pentru a fi introduse în BEAGLE
program. Această opțiune necesită ca fișierul VCF să conțină eticheta FORMAT GL, ceea ce poate
în general, sunt transmise de apelanții SNP, cum ar fi GATK. Utilizarea acestei opțiuni necesită a
cromozomul trebuie specificat prin opțiunea --chr. Fișierul de ieșire rezultat (cu
sufixul „.BEAGLE.GL”) conține probabilități de genotip pentru siturile bialelice și este
potrivit pentru introducerea în BEAGLE prin argumentul „like=”.

--plink
Această opțiune scoate datele genotipului în format PLINK PED. Sunt generate două fișiere,
cu sufixele „.ped” și „.map”. Rețineți că vor fi afișate numai loci bi-alelici.
Mai multe detalii despre aceste fișiere pot fi găsite în documentația PLINK.

Notă: această opțiune poate fi foarte lentă pe seturi de date mari. Folosind opțiunea --chr pentru a
Se recomandă împărțirea setului de date.

--plink-tped
Opțiunea --plink de mai sus poate fi extrem de lentă pe seturi de date mari. O alternativa
care ar putea fi considerabil mai rapid este scoaterea în formatul transpus PLINK.
Acest lucru poate fi realizat folosind opțiunea --plink-tped, care produce două fișiere cu
sufixele „.tped” și „.tfam”.

--recodificați
Opțiunea --recode este utilizată pentru a genera un fișier VCF din fișierul VCF de intrare care are
a aplicat opțiunile specificate de utilizator. Fișierul de ieșire are sufixul
„.recode.vcf”.

În mod implicit, câmpurile INFO sunt eliminate din fișierul de ieșire, ca valori INFO
poate fi invalidată de recodificare (de exemplu, adâncimea totală poate fi necesar să fie
recalculat dacă indivizi sunt îndepărtați). Această funcționalitate implicită poate fi
suprascris prin utilizarea --keep-INFO opțiunea, unde defineste
Tasta INFO de păstrat în fișierul de ieșire. Indicatorul --keep-INFO poate fi folosit de mai multe ori
ori. Alternativ, opțiunea --keep-INFO-all poate fi folosită pentru a păstra toate INFORMAȚII
domenii.

Diverse
--extract-FORMAT-info
Extrageți informații din câmpurile genotipului din fișierul VCF referitoare la un specificat
identificatorul FORMAT. De exemplu, folosind opțiunea „--extract-FORMAT-info GT” ar fi
extrageți toate intrările GT (adică Genotip). Fișierul de ieșire rezultat are
sufixul '. .FORMAT'.

--obtine informatii
Această opțiune este folosită pentru a extrage informații din câmpul INFO din fișierul VCF. The
argument specifică eticheta INFO care trebuie extrasă, iar opțiunea poate fi
utilizat de mai multe ori pentru a extrage mai multe intrări INFO. Fișierul rezultat,
cu sufixul „.INFO”, conține informațiile INFO necesare într-un tabulator separat
masa. De exemplu, pentru a extrage steagurile NS și DB, se va folosi comanda:

vcftools --vcf file1.vcf --get-INFO NS --get-INFO DB

TU F Fișier Comparaţie Opţiuni
Opțiunile de comparare a fișierelor sunt în prezent într-o stare de flux și probabil cu erori. daca tu
găsiți o eroare, vă rugăm să o raportați. Rețineți că filtrele la nivel de genotip nu sunt acceptate în acestea
opțiuni.

--dif

--gzdiff
Selectați un fișier VCF pentru comparare cu fișierul specificat de opțiunea --vcf.
Afișează două fișiere care descriu site-urile și persoanele comune / unice pentru fiecare
fişier. Aceste fișiere au sufixele „.diff.sites_in_files” și
respectiv „.diff.indv_in_files”. Versiunea --gzdiff poate fi folosită pentru a citi
fișiere VCF comprimate.

--diff-site-discordance
Folosit împreună cu opțiunea --diff pentru a calcula discordanța pe un site de
baza site-ului. Fișierul rezultat are sufixul „.diff.sites”.

--diff-indv-discordance
Folosit împreună cu opțiunea --diff pentru a calcula discordanța pe o per-
pe bază individuală. Fișierul rezultat are sufixul „.diff.indv”.

--dif-discordanță-matrice
Folosit împreună cu opțiunea --diff pentru a calcula o matrice de discordanță. Acest
opțiunea funcționează numai cu loci bi-alelici cu alele care se potrivesc care sunt prezente în
ambele fișiere. Fișierul rezultat are sufixul „.diff.discordance.matrix”.

--diff-switch-error
Folosit împreună cu opțiunea --diff pentru a calcula erorile de fază
(în special „erori de comutare”). Această opțiune generează două fișiere de ieșire care descriu
erorile de comutare găsite între site-uri și eroarea medie de comutare pe individ.
Aceste două fișiere au sufixele „.diff.switch” și „.diff.indv.switch”
respectiv.

Opţiuni încă in dezvoltare
Următoarele opțiuni nu au fost încă finalizate, este posibil să conțină erori și sunt probabile
să se schimbe în viitor.

--fst

--gzfst
Calculați FST pentru o pereche de fișiere VCF, al doilea fișier fiind specificat de aceasta
opțiune. FST este în prezent calculat folosind formula descrisă în
material suplimentar al lucrării Faza I HapMap. În prezent, numai FST pe perechi
calculele sunt acceptate, deși probabil că acest lucru se va schimba în viitor. The
Opțiunea --gzfst poate fi folosită pentru a citi fișierele VCF comprimate.

--LROH Identificați perioade lungi de omozigoză.

--legătura
Ieșire Statistici de relație individuală.

Utilizați vcftools online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

  • 1
    Firebird
    Firebird
    Firebird RDBMS oferă caracteristici ANSI SQL
    și rulează pe Linux, Windows și
    mai multe platforme Unix. Caracteristici
    concurență și performanță excelente
    & putere...
    Descărcați Firebird
  • 2
    KompoZer
    KompoZer
    KompoZer este un editor HTML wysiwyg care utilizează
    baza de cod Mozilla Composer. La fel de
    Dezvoltarea Nvu a fost oprită
    în 2005, KompoZer remediază multe erori și
    adaugă un f...
    Descărcați KompoZer
  • 3
    Descărcător gratuit de manga
    Descărcător gratuit de manga
    Free Manga Downloader (FMD) este un
    aplicație open source scrisă în
    Object-Pascal pentru gestionarea și
    descărcarea manga de pe diverse site-uri web.
    Aceasta este o oglindă...
    Descărcați gratuit Manga Downloader
  • 4
    UNetbootin
    UNetbootin
    UNetbootin vă permite să creați bootable
    Unități USB live pentru Ubuntu, Fedora și
    alte distribuții Linux fără
    arderea unui CD. Se rulează pe Windows, Linux,
    şi ...
    Descărcați UNetbootin
  • 5
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM este ușor de utilizat
    Pachetul software ERP și CRM open source
    (rulați cu un server web php sau ca
    software autonom) pentru companii,
    fundatii...
    Descărcați Dolibarr ERP - CRM
  • 6
    Client SQL SQuirreL
    Client SQL SQuirreL
    SQuirreL SQL Client este un SQL grafic
    client scris în Java care va permite
    pentru a vizualiza structura unui JDBC
    baza de date conformă, răsfoiți datele în
    Mese...
    Descărcați SQuirreL SQL Client
  • Mai mult »

Comenzi Linux

Ad