InggrisPerancisSpanyol

Ad


favorit OnWorks

vcftools - Online di Cloud

Jalankan vcftools di penyedia hosting gratis OnWorks melalui Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

Ini adalah perintah vcftools yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

PROGRAM:

NAMA


vcftools - menganalisis file VCF

RINGKASAN


alat vcf [PILIHAN]

DESKRIPSI


Program vcftools dijalankan dari baris perintah. Antarmukanya terinspirasi oleh PLINK, dan
jadi sebagian besar harus akrab bagi pengguna paket itu. Perintah mengambil bentuk berikut:

vcftools --vcf file1.vcf --chr 20 --freq

Perintah di atas memberitahu vcftools untuk membaca di file file1.vcf, ekstrak situs di
kromosom 20, dan hitung frekuensi alel di setiap lokasi. Alel yang dihasilkan
perkiraan frekuensi disimpan dalam file output, out.freq. Seperti pada contoh di atas,
keluaran dari vcftools sebagian besar dikirim ke file keluaran, berbeda dengan yang ditampilkan di
layar.

Perhatikan bahwa beberapa perintah mungkin hanya tersedia di vcftools versi terbaru. Untuk memperoleh
versi terbaru, Anda harus menggunakan SVN untuk memeriksa kode terbaru, seperti yang dijelaskan di
halaman rumah.

Perhatikan juga bahwa genotipe poliploid saat ini tidak didukung.

Dasar Opsi
--vcf
Opsi ini menentukan file VCF yang akan diproses. File perlu didekompresi
sebelum digunakan dengan vcftools. vcftools mengharapkan file dalam format VCF v4.0, a
spesifikasi yang dapat ditemukan di sini.

--gzvcf
Opsi ini dapat digunakan sebagai pengganti opsi --vcf untuk membaca terkompresi (gzip)
file VCF secara langsung. Perhatikan bahwa opsi ini bisa sangat lambat bila digunakan dengan besar
file.

--keluar
Opsi ini mendefinisikan awalan nama file keluaran untuk semua file yang dihasilkan oleh vcftools.
Misalnya, jika diatur ke output_filename, maka semua file output akan menjadi
dari bentuk output_filename.*** . Jika opsi ini dihilangkan, semua file keluaran akan
memiliki awalan 'keluar'.

situs Filter Opsi
--chr
Hanya memproses situs dengan pencocokan pengidentifikasi kromosom

--dari-bp

--ke-bp
Pilihan ini menentukan jangkauan fisik situs yang akan diproses. Situs di luar
kisaran ini akan dikecualikan. Opsi ini hanya dapat digunakan bersama dengan
--chr.

--snp
Sertakan SNP dengan ID yang cocok. Perintah ini dapat digunakan beberapa kali secara berurutan
untuk memasukkan lebih dari satu SNP.

--snps
Sertakan daftar SNP yang diberikan dalam file. File harus berisi daftar ID SNP,
dengan satu ID per baris.

--mengecualikan
Kecualikan daftar SNP yang diberikan dalam file. File harus berisi daftar ID SNP,
dengan satu ID per baris.

--posisi
Sertakan satu set situs berdasarkan daftar posisi. Setiap baris input
file harus berisi kromosom dan posisi (dipisahkan tab). File harus
memiliki garis kepala. Situs yang tidak termasuk dalam daftar dikecualikan.

--tempat tidur

--tidak termasuk-tempat tidur
Menyertakan atau mengecualikan sekumpulan situs berdasarkan file BED. Hanya tiga yang pertama
kolom (chrom, chromStart, dan chromEnd) diperlukan. File BED harus memiliki:
garis kepala.

--hapus-difilter-semua

--hapus-difilter

--terus-difilter
Opsi ini digunakan untuk memfilter situs berdasarkan bendera FILTER mereka. NS
opsi pertama menghapus semua situs dengan bendera FILTER. Opsi kedua dapat digunakan untuk
mengecualikan situs dengan bendera filter tertentu. Opsi ketiga dapat digunakan untuk memilih
situs berdasarkan bendera filter tertentu. Pilihan kedua dan ketiga bisa
digunakan beberapa kali untuk menentukan beberapa FILTER. Opsi --keep-filtered adalah
diterapkan sebelum opsi --remove-filtered.

--minQ
Hanya sertakan situs dengan Kualitas di atas ambang ini.

--min-rata-rataDP

--maks-rata-rataDP
Sertakan situs dengan Kedalaman rata-rata dalam ambang batas yang ditentukan oleh opsi ini.

--maf

--maks-maf
Sertakan hanya situs dengan Frekuensi Alel Kecil dalam rentang yang ditentukan.

--non-ref-af

--max-non-ref-af
Sertakan hanya situs dengan Frekuensi Alel Non-Referensi dalam rentang yang ditentukan.

--warna
Menilai situs untuk Hardy-Weinberg Equilibrium menggunakan tes yang tepat, seperti yang didefinisikan oleh
Wigginton, Cutler dan Abecasis (2005). Situs dengan nilai p di bawah ambang batas
ditentukan oleh opsi ini dianggap keluar dari HWE, dan karenanya dikecualikan.

--geno
Kecualikan situs berdasarkan proporsi data yang hilang (didefinisikan antara
0 dan 1).

--min-alel

--maks-alel
Sertakan hanya situs dengan sejumlah alel dalam rentang yang ditentukan. Untuk
misalnya, untuk hanya memasukkan situs bi-allelic, seseorang dapat menggunakan:

vcftools --vcf file1.vcf --min-alel 2 --max-alel 2

--masker

--invert-topeng

--topeng-min
Sertakan situs berdasarkan file seperti FASTA. File yang disediakan berisi
urutan digit bilangan bulat (antara 0 dan 9) untuk setiap posisi pada kromosom yang
tentukan apakah situs pada posisi itu harus difilter atau tidak. Contoh file topeng
akan terlihat seperti:

>1
0000011111222 ...

Dalam contoh ini, situs dalam file VCF terletak di dalam 5 basis pertama dari
awal kromosom 1 akan disimpan, sedangkan situs di posisi 6 dan seterusnya akan
disaring. Bilangan bulat ambang yang menentukan apakah situs difilter atau tidak adalah
atur menggunakan opsi --mask-min, yang defaultnya ke 0. Kromosom yang terkandung dalam
file mask harus diurutkan dalam urutan yang sama dengan file VCF. Opsi --mask
digunakan untuk menentukan file mask yang akan digunakan, sedangkan opsi --invert-mask dapat
digunakan untuk menentukan file mask yang akan dibalik sebelum diterapkan.

Individu filter
--indv
Tentukan individu yang akan disimpan dalam analisis. Opsi ini dapat digunakan beberapa
kali untuk menentukan beberapa individu.

--menyimpan
Berikan file yang berisi daftar individu untuk disertakan dalam analisis berikutnya.
Setiap ID individu (sebagaimana didefinisikan dalam baris judul VCF) harus disertakan pada a
garis terpisah.

--hapus-indv
Tentukan individu yang akan dikeluarkan dari analisis. Opsi ini dapat digunakan
beberapa kali untuk menentukan beberapa individu. Jika opsi --indv juga
ditentukan, maka opsi --indv dijalankan sebelum opsi --remove-indv.

--menghapus
Berikan file yang berisi daftar individu untuk dikecualikan dalam analisis selanjutnya.
Setiap ID individu (sebagaimana didefinisikan dalam baris judul VCF) harus disertakan pada a
baris terpisah. Jika opsi --keep dan --remove digunakan, maka
--keep opsi dijalankan sebelum opsi --remove.

--mon-indv-meanDP

--max-indv-rata-rataDP
Hitung cakupan rata-rata per individu. Hanya individu dengan
cakupan dalam kisaran yang ditentukan oleh opsi ini termasuk dalam berikut
analisis.

--pikiran
Tentukan ambang batas tarif panggilan minimum untuk setiap individu.

--bertahap
Pertama mengecualikan semua individu yang memiliki semua genotipe tidak berfase, dan selanjutnya
mengecualikan semua situs dengan genotipe tidak bertahap. Oleh karena itu, data yang tersisa terdiri dari:
data bertahap saja.

Genotip filter
--hapus-filtered-geno-all

--hapus-filter-geno
Opsi pertama menghapus semua genotipe dengan bendera FILTER. Opsi kedua bisa menjadi
digunakan untuk mengecualikan genotipe dengan bendera filter tertentu.

--minGQ
Kecualikan semua genotipe dengan kualitas di bawah ambang batas yang ditentukan oleh opsi ini
(GQ).

--minDP
Kecualikan semua genotipe dengan kedalaman pengurutan di bawah yang ditentukan oleh opsi ini
(SD)

Keluaran statistika
--frekuensi

--menghitung

--frekuensi2

--hitungan2
Keluarkan informasi frekuensi per situs. --freq mengeluarkan frekuensi alel dalam a
file dengan akhiran '.frq'. Opsi --counts mengeluarkan file serupa dengan
akhiran '.frq.count', yang berisi jumlah alel mentah di setiap situs. --freq2
dan opsi --count2 digunakan untuk menekan informasi alel dalam file keluaran. Di dalam
dalam hal ini, urutan freqs/counts tergantung pada penomoran dalam file VCF.

--kedalaman
Menghasilkan file yang berisi kedalaman rata-rata per individu. File ini memiliki akhiran
'.idepth'.

--kedalaman situs

--situs-rata-rata-kedalaman
Menghasilkan file yang berisi kedalaman per situs. Opsi --site-depth menampilkan
kedalaman untuk setiap situs dijumlahkan di seluruh individu. File ini memiliki akhiran '.ldepth'.
Demikian juga, --site-mean-depth menampilkan kedalaman rata-rata untuk setiap situs, dan
file output memiliki akhiran '.ldepth.mean'.

--geno-kedalaman
Menghasilkan file (mungkin sangat besar) yang berisi kedalaman untuk setiap genotipe di
file VCFnya. Entri yang hilang diberi nilai -1. File tersebut memiliki akhiran
'.gdepth'.

--kualitas situs
Menghasilkan file yang berisi kualitas SNP per situs, seperti yang ditemukan di kolom QUAL
dari file VCF. File ini memiliki akhiran '.lqual'.

--dia T Menghitung ukuran heterozigositas pada basis per individu. Secara spesifik,
koefisien perkawinan sedarah, F, diperkirakan untuk setiap individu dengan menggunakan metode
momen. File yang dihasilkan memiliki akhiran '.het'.

--kuat
Melaporkan nilai-p untuk setiap situs dari uji Kesetimbangan Hardy-Weinberg (sebagaimana didefinisikan
oleh Wigginton, Cutler dan Abecasis (2005)). File yang dihasilkan (dengan akhiran '.hwe')
juga berisi jumlah Homozigot dan Heterozigot yang Diamati dan
sesuai Angka yang diharapkan di bawah HWE.

--hilang
Menghasilkan dua file yang melaporkan hilangnya per-individu dan per-situs
dasar. Kedua file memiliki akhiran '.imiss' dan '.lmiss' masing-masing.

--hap-r2

--geno-r2

--ld-jendela

--ld-jendela-bp

--min-r2
Opsi ini digunakan untuk melaporkan statistik Linkage Disequilibrium (LD) sebagai
diringkas oleh statistik r2. Opsi --hap-r2 menginformasikan vcftools untuk menampilkan a
file yang melaporkan statistik r2 menggunakan haplotipe bertahap. Ini tradisional
ukuran LD sering dilaporkan dalam literatur genetika populasi. Jika bertahap
haplotipe tidak tersedia maka opsi --geno-r2 dapat digunakan, yang menghitung
koefisien korelasi kuadrat antara genotipe yang dikodekan sebagai 0, 1 dan 2 untuk
mewakili jumlah alel non-referensi pada setiap individu. Ini sama
sebagai ukuran LD yang dilaporkan oleh PLINK. Versi haplotype mengeluarkan file dengan
akhiran '.hap.ld', sedangkan versi genotipe mengeluarkan file dengan akhiran
'.geno.ld'. Versi haplotype menyiratkan opsi --phased.

Opsi --ld-window mendefinisikan pemisahan SNP maksimum untuk perhitungan
LD. Demikian juga, opsi --ld-window-bp dapat digunakan untuk menentukan fisik maksimum
pemisahan SNP termasuk dalam perhitungan LD. Akhirnya, --min-r2 menetapkan a
nilai minimum untuk r2 di bawah mana statistik LD tidak dilaporkan.

--SNPdnsitas
Menghitung jumlah dan kepadatan SNP dalam ukuran bin yang ditentukan oleh opsi ini.
File output yang dihasilkan memiliki akhiran '.snpden'.

--TsTv
Menghitung rasio Transisi / Transversi dalam ukuran bin yang ditentukan oleh ini
pilihan. File output yang dihasilkan memiliki akhiran '.TsTv'. Ringkasan juga
disediakan dalam file dengan akhiran '.TsTv.summary'.

--FILTER-ringkasan
Menghasilkan ringkasan jumlah SNP dan rasio Ts/Tv untuk setiap kategori FILTER.
File keluaran memiliki akhiran '.FILTER.summary.

--filtered-situs
Membuat dua file daftar situs yang telah disimpan atau dihapus setelah penyaringan. NS
file pertama, dengan akhiran '.kept.sites', mencantumkan situs yang disimpan oleh vcftools setelah filter
telah diterapkan. File kedua, dengan akhiran '.removed.sites', daftar situs
dihapus oleh filter yang diterapkan.

--lajang
Opsi ini akan menghasilkan file yang merinci lokasi lajang, dan
individu tempat mereka berada. File melaporkan lajang sejati, dan pribadi
doubletons (yaitu SNP di mana alel minor hanya terjadi pada satu individu dan
individu itu homozigot untuk alel itu). File keluaran memiliki akhiran
'.lajang'.

--situs-pi

--jendela-pi
Pilihan ini digunakan untuk memperkirakan tingkat keragaman nukleotida. Opsi pertama
melakukan ini pada basis per situs, dan file keluaran memiliki akhiran '.sites.pi'. NS
opsi kedua menghitung keragaman nukleotida di jendela, dengan ukuran jendela
didefinisikan dalam argumen opsi. Output untuk opsi ini memiliki akhiran
'.windowed.pi'. Versi berjendela membutuhkan data bertahap, dan karenanya menggunakan ini
opsi menyiratkan opsi --phased.

Keluaran in Lainnya Format
--O12 Opsi ini menampilkan genotipe sebagai matriks besar. Tiga file diproduksi. NS
pertama, dengan akhiran '.012', berisi genotipe masing-masing individu secara terpisah
garis. Genotipe direpresentasikan sebagai 0, 1 dan 2, di mana angka tersebut menyatakan bahwa
jumlah alel non-referensi. Genotipe yang hilang diwakili oleh -1. NS
file kedua, dengan akhiran '.012.indv' merinci individu yang disertakan dalam file utama
mengajukan. File ketiga, dengan akhiran '.012.pos' merinci lokasi situs yang disertakan
file utama.

--MENYALAHKAN
Opsi ini mengeluarkan haplotipe bertahap dalam format panel referensi IMPUT. Sebagai IMPUT
memerlukan data bertahap, menggunakan opsi ini juga menyiratkan --bertahap. Tidak bertahap
individu dan genotipe karena itu dikecualikan. Hanya situs bi-allelic yang
termasuk dalam keluaran. Menggunakan opsi ini menghasilkan tiga file. IMPUTE
file haplotype memiliki akhiran '.impute.hap', dan file legenda IMPute memiliki
akhiran '.impute.hap.legend'. File ketiga, dengan akhiran '.impute.hap.indv',
merinci individu yang disertakan dalam file haplotype, meskipun file ini tidak
dibutuhkan oleh IMPUT.

--lhat

--ldhat-geno
Opsi ini mengeluarkan data dalam format LDhat. Penggunaan opsi ini juga memerlukan
--chr opsi untuk digunakan. Opsi --ldhat hanya mengeluarkan data bertahap, dan karenanya
juga menyiratkan --bertahap, yang mengarah ke individu dan genotipe yang tidak berfase
pengecualian. Atau, opsi --ldhat-geno memperlakukan semua data sebagai
unphased, dan karena itu mengeluarkan file LDhat dalam format genotipe/tidak berfase. baik
kasus, dua file dihasilkan dengan akhiran '.ldhat.sites' dan '.ldhat.locs',
yang masing-masing sesuai dengan file input 'situs' dan 'locs' LDhat.

--BEAGLE-GL
Opsi ini mengeluarkan informasi kemungkinan genotipe untuk dimasukkan ke dalam BEAGLE
program. Opsi ini mengharuskan file VCF berisi tag FORMAT GL, yang dapat
umumnya akan dikeluarkan oleh pemanggil SNP seperti GATK. Penggunaan opsi ini memerlukan
kromosom yang akan ditentukan melalui opsi --chr. File keluaran yang dihasilkan (dengan
akhiran '.BEAGLE.GL') berisi kemungkinan genotipe untuk situs biallelic, dan
cocok untuk dimasukkan ke dalam BEAGLE melalui argumen 'like='.

--plink
Opsi ini mengeluarkan data genotipe dalam format PLINK PED. Dua file dihasilkan,
dengan akhiran '.ped' dan '.map'. Perhatikan bahwa hanya lokus bi-allelik yang akan dikeluarkan.
Rincian lebih lanjut dari file-file ini dapat ditemukan di dokumentasi PLINK.

Catatan: Opsi ini bisa sangat lambat pada kumpulan data yang besar. Menggunakan opsi --chr untuk
membagi dataset disarankan.

--plink-tped
Opsi --plink di atas bisa sangat lambat pada kumpulan data besar. Sebuah alternatif
yang mungkin jauh lebih cepat adalah output dalam format transposed PLINK.
Ini dapat dicapai dengan menggunakan opsi --plink-tped, yang menghasilkan dua file dengan
akhiran '.tped' dan '.tfam'.

--kode ulang
Opsi --recode digunakan untuk menghasilkan file VCF dari file input VCF yang memiliki:
menerapkan opsi yang ditentukan oleh pengguna. File keluaran memiliki akhiran
'.recode.vcf'.

Secara default, bidang INFO dihapus dari file output, karena nilai INFO
dapat dibatalkan oleh pengodean ulang (misalnya kedalaman total mungkin perlu
dihitung ulang jika individu dihapus). Fungsionalitas default ini dapat berupa
diganti dengan menggunakan --keep-INFO pilihan, dimana mendefinisikan
Kunci INFO untuk disimpan dalam file output. Bendera --keep-INFO dapat digunakan beberapa kali
waktu. Atau, opsi --keep-INFO-all dapat digunakan untuk menyimpan semua INFO
bidang.

bermacam-macam
--ekstrak-FORMAT-info
Ekstrak informasi dari bidang genotipe dalam file VCF yang berkaitan dengan yang ditentukan
pengenal FORMAT. Misalnya, menggunakan opsi '--extract-FORMAT-info GT' akan
ekstrak semua entri GT (yaitu Genotipe). File output yang dihasilkan memiliki
akhiran '. .FORMAT'.

--Mendapatkan informasi
Opsi ini digunakan untuk mengekstrak informasi dari bidang INFO dalam file VCF. NS
argumen menentukan tag INFO yang akan diekstraksi, dan opsinya bisa:
digunakan beberapa kali untuk mengekstrak beberapa entri INFO. Berkas yang dihasilkan
dengan akhiran '.INFO', berisi informasi INFO yang diperlukan dalam tab yang dipisahkan
meja. Misalnya, untuk mengekstrak flag NS dan DB, seseorang akan menggunakan perintah:

vcftools --vcf file1.vcf --dapatkan-INFO NS --dapatkan-INFO DB

VCF File Perbandingan Opsi
Opsi perbandingan file saat ini dalam keadaan fluks dan kemungkinan bermasalah. Jika kamu
menemukan bug, silakan laporkan. Perhatikan bahwa filter tingkat genotipe tidak didukung dalam ini
Pilihan.

--dif

--gzdiff
Pilih file VCF untuk perbandingan dengan file yang ditentukan oleh opsi --vcf.
Keluaran dua file yang menjelaskan situs dan individu yang umum / unik untuk masing-masing
mengajukan. File-file ini memiliki akhiran '.diff.sites_in_files' dan
'.diff.indv_in_files' masing-masing. Versi --gzdiff dapat digunakan untuk membaca
file VCF terkompresi.

--diff-site-discordance
Digunakan bersama dengan opsi --diff untuk menghitung ketidaksesuaian di situs dengan
dasar situs. File keluaran yang dihasilkan memiliki akhiran '.diff.sites'.

--diff-indv-ketidaksesuaian
Digunakan bersama dengan opsi --diff untuk menghitung ketidaksesuaian pada per-
dasar individu. File output yang dihasilkan memiliki akhiran '.diff.indv'.

--diff-discordance-matriks
Digunakan bersama dengan opsi --diff untuk menghitung matriks ketidaksesuaian. Ini
opsi hanya bekerja dengan lokus bi-alel dengan alel yang cocok yang ada di
kedua file. File output yang dihasilkan memiliki akhiran '.diff.discordance.matrix'.

--diff-saklar-kesalahan
Digunakan bersama dengan opsi --diff untuk menghitung kesalahan pentahapan
(khususnya 'beralih kesalahan'). Opsi ini menghasilkan dua file keluaran yang menjelaskan
kesalahan sakelar yang ditemukan di antara situs, dan kesalahan sakelar rata-rata per individu.
Kedua file ini memiliki akhiran '.diff.switch' dan '.diff.indv.switch'
masing.

Opsi masih in pengembangan
Opsi berikut belum diselesaikan, kemungkinan mengandung bug, dan kemungkinan besar
untuk berubah di masa depan.

--pertama

--gzfst
Hitung FST untuk sepasang file VCF, dengan file kedua ditentukan oleh ini
pilihan. FST saat ini dihitung menggunakan rumus yang dijelaskan dalam
bahan pelengkap makalah HapMap Tahap I. Saat ini, hanya FST berpasangan
perhitungan didukung, meskipun ini kemungkinan akan berubah di masa mendatang. NS
--gzfst opsi dapat digunakan untuk membaca file VCF terkompresi.

--LROH Identifikasi Jangka Panjang Homozigositas.

--keterkaitan
Output Statistik Keterkaitan Individu.

Gunakan vcftools online menggunakan layanan onworks.net


Server & Workstation Gratis

Unduh aplikasi Windows & Linux

  • 1
    Burung api
    Burung api
    Firebird RDBMS menawarkan fitur ANSI SQL
    & berjalan di Linux, Windows &
    beberapa platform Unix. Fitur
    konkurensi & kinerja yang sangat baik
    & kekuasaan...
    Unduh Firebird.dll
  • 2
    KompoZer
    KompoZer
    KompoZer adalah editor HTML wysiwyg menggunakan
    basis kode Mozilla Composer. Sebagai
    Pengembangan Nvu telah dihentikan
    pada tahun 2005, KompoZer memperbaiki banyak bug dan
    menambahkan f...
    Unduh KompoZer.dll
  • 3
    Pengunduh Manga Gratis
    Pengunduh Manga Gratis
    Pengunduh Manga Gratis (FMD) adalah
    aplikasi sumber terbuka ditulis dalam
    Object-Pascal untuk mengelola dan
    mengunduh manga dari berbagai situs web.
    Ini cermin...
    Unduh Pengunduh Manga Gratis
  • 4
    Aetbootin
    Aetbootin
    UNetbootin memungkinkan Anda membuat bootable
    Drive USB langsung untuk Ubuntu, Fedora, dan
    distribusi Linux lainnya tanpa
    membakar CD. Ini berjalan di Windows, Linux,
    dan ...
    Unduh UNetbootin.dll
  • 5
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM mudah digunakan
    Paket perangkat lunak open source ERP dan CRM
    (dijalankan dengan server php web atau sebagai
    perangkat lunak mandiri) untuk bisnis,
    yayasan...
    Unduh Dolibarr ERP - CRM
  • 6
    Klien SQL SQuirreL
    Klien SQL SQuirreL
    SQuirreL SQL Client adalah SQL grafis
    klien yang ditulis dalam Java yang memungkinkan
    Anda untuk melihat struktur JDBC
    database yang sesuai, jelajahi data di
    meja...
    Unduh SQuirreL SQL Client
  • Lebih banyak lagi »

Perintah Linux

Ad