ภาษาอังกฤษภาษาฝรั่งเศสสเปน

Ad


ไอคอน Fav ของ OnWorks

vcftools - ออนไลน์ใน Cloud

เรียกใช้ vcftools ในผู้ให้บริการโฮสต์ฟรีของ OnWorks ผ่าน Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

นี่คือคำสั่ง vcftools ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

โครงการ:

ชื่อ


vcftools - วิเคราะห์ไฟล์ VCF

เรื่องย่อ


vcftools [OPTIONS]

DESCRIPTION


โปรแกรม vcftools ถูกเรียกใช้จากบรรทัดคำสั่ง อินเทอร์เฟซได้รับแรงบันดาลใจจาก PLINK และ
ดังนั้นผู้ใช้แพ็คเกจนั้นน่าจะคุ้นเคยเป็นอย่างดี คำสั่งมีรูปแบบดังต่อไปนี้:

vcftools --vcf file1.vcf --chr 20 --ความถี่

คำสั่งดังกล่าวบอกให้ vcftools อ่านในไฟล์ file1.vcf แยกไซต์บน
โครโมโซม 20 และคำนวณความถี่อัลลีลในแต่ละจุด อัลลีลที่ได้
ค่าประมาณความถี่จะถูกเก็บไว้ในไฟล์เอาต์พุต out.freq ดังตัวอย่างข้างต้น
เอาต์พุตจาก vcftools ส่วนใหญ่ส่งไปยังไฟล์เอาต์พุต แทนที่จะแสดงบน
จอภาพ

โปรดทราบว่าคำสั่งบางคำสั่งอาจมีเฉพาะใน vcftools เวอร์ชันล่าสุดเท่านั้น ที่จะได้รับ
เวอร์ชันล่าสุด คุณควรใช้ SVN เพื่อชำระเงินโค้ดล่าสุด ตามที่อธิบายไว้ใน
หน้าแรก

โปรดทราบว่าขณะนี้ยังไม่รองรับจีโนไทป์โพลีพลอยด์

ขั้นพื้นฐาน Options
--vcf
ตัวเลือกนี้กำหนดไฟล์ VCF ที่จะประมวลผล ไฟล์ต้องแตกไฟล์
ก่อนใช้กับ vcftools vcftools ต้องการไฟล์ในรูปแบบ VCF v4.0, a
ซึ่งสามารถดูได้ที่นี่

--gzvcf
สามารถใช้ตัวเลือกนี้แทนตัวเลือก --vcf เพื่ออ่านการบีบอัด (gzipped)
ไฟล์ VCF โดยตรง โปรดทราบว่าตัวเลือกนี้อาจค่อนข้างช้าเมื่อใช้กับขนาดใหญ่
ไฟล์

--ออก
ตัวเลือกนี้กำหนดคำนำหน้าชื่อไฟล์เอาต์พุตสำหรับไฟล์ทั้งหมดที่สร้างโดย vcftools
ตัวอย่างเช่น if ถูกตั้งค่าเป็น output_filename จากนั้นไฟล์เอาท์พุตทั้งหมดจะเป็น
ของแบบฟอร์ม output_filename.*** หากละเว้นตัวเลือกนี้ ไฟล์ที่ส่งออกทั้งหมดจะ
มีคำนำหน้า 'ออก'

เว็บไซต์ ตัวกรอง Options
--chr
ดำเนินการเฉพาะไซต์ที่มีการจับคู่ตัวระบุโครโมโซม

--จาก-bp

--to-bp
ตัวเลือกเหล่านี้กำหนดช่วงทางกายภาพของไซต์ที่จะถูกประมวลผล เว็บไซต์ภายนอก
ของช่วงนี้จะถูกยกเว้น ตัวเลือกเหล่านี้สามารถใช้ร่วมกับ .เท่านั้น
--ค.

--snp
รวม SNP ที่มี ID ที่ตรงกัน คำสั่งนี้ใช้ได้หลายครั้งตามลำดับ
เพื่อรวม SNP มากกว่าหนึ่งรายการ

--snps
รวมรายการ SNP ที่ระบุในไฟล์ ไฟล์ควรมีรายการ SNP ID
ด้วยหนึ่ง ID ต่อบรรทัด

--ไม่รวม
ไม่รวมรายการ SNP ที่ระบุในไฟล์ ไฟล์ควรมีรายการ SNP ID
ด้วยหนึ่ง ID ต่อบรรทัด

--ตำแหน่ง
รวมชุดของไซต์ตามรายการตำแหน่ง แต่ละบรรทัดของอินพุต
ไฟล์ควรมีโครโมโซม (คั่นด้วยแท็บ) และตำแหน่ง ไฟล์ควร
มีหัวเรื่อง ไม่รวมไซต์ที่ไม่รวมอยู่ในรายการ

--เตียง

--ไม่รวม-เตียง
รวมหรือแยกชุดของไซต์ตามไฟล์ BED สามตัวแรกเท่านั้น
ต้องมีคอลัมน์ (chrom, chromStart และ chromEnd) ไฟล์ BED ควรมี a
บรรทัดส่วนหัว

--remove-กรอง-ทั้งหมด

--remove-กรอง

--เก็บกรอง
ตัวเลือกเหล่านี้ใช้เพื่อกรองไซต์โดยใช้แฟล็ก FILTER NS
ตัวเลือกแรกจะลบไซต์ทั้งหมดที่มีแฟล็ก FILTER ตัวเลือกที่สองสามารถใช้เพื่อ
ยกเว้นไซต์ที่มีแฟล็กตัวกรองเฉพาะ ตัวเลือกที่สามสามารถใช้เพื่อเลือก
ไซต์บนพื้นฐานของแฟล็กตัวกรองเฉพาะ ตัวเลือกที่สองและสามสามารถเป็น
ใช้หลายครั้งเพื่อระบุตัวกรองหลายตัว ตัวเลือก --keep-filtered คือ
ใช้ก่อนตัวเลือก --remove-filtered

--minQ
รวมเฉพาะไซต์ที่มีคุณภาพเหนือเกณฑ์นี้

--min-meanDP

--สูงสุด-meanDP
รวมไซต์ที่มีความลึกเฉลี่ยภายในเกณฑ์ที่กำหนดโดยตัวเลือกเหล่านี้

--มาฟ

--max-maf
รวมเฉพาะไซต์ที่มีความถี่ไมเนอร์อัลลีลภายในช่วงที่ระบุ

--ไม่ใช่การอ้างอิง AF

--max-non-ref-af
รวมเฉพาะไซต์ที่มีความถี่อัลลีลที่ไม่อ้างอิงภายในช่วงที่ระบุ

--ฮิว
ประเมินไซต์สำหรับ Hardy-Weinberg Equilibrium โดยใช้การทดสอบที่แน่นอน ตามที่กำหนดโดย
Wigginton, Cutler และ Abecasis (2005) ไซต์ที่มีค่า p ต่ำกว่าเกณฑ์
ที่กำหนดโดยตัวเลือกนี้จะถูกนำออกจาก HWE และถูกยกเว้น

--เจโน่
ยกเว้นไซต์ตามสัดส่วนของข้อมูลที่ขาดหายไป (กำหนดให้อยู่ระหว่าง
0 และ 1)

--min-อัลลีล

--max-อัลลีล
รวมเฉพาะไซต์ที่มีอัลลีลจำนวนหนึ่งภายในช่วงที่ระบุ สำหรับ
ตัวอย่างเช่น หากต้องการรวมเฉพาะไซต์แบบไบอัลลีลิก เราสามารถใช้:

vcftools --vcf file1.vcf --min-อัลลีล 2 --max-อัลลีล 2

--หน้ากาก

--invert-หน้ากาก

--mask-มิน
รวมไซต์โดยใช้ไฟล์ที่คล้ายกับ FASTA ไฟล์ที่ให้มาประกอบด้วย a
ลำดับของเลขจำนวนเต็ม (ระหว่าง 0 ถึง 9) สำหรับแต่ละตำแหน่งบนโครโมโซมที่
ระบุว่าควรกรองไซต์ในตำแหน่งนั้นหรือไม่ ตัวอย่างไฟล์มาสก์
จะมีลักษณะดังนี้:

>1
0000011111222 ...

ในตัวอย่างนี้ ไซต์ในไฟล์ VCF ที่อยู่ภายใน 5 ฐานแรกของ
จุดเริ่มต้นของโครโมโซม 1 จะถูกเก็บไว้ ในขณะที่ตำแหน่งที่ 6 เป็นต้นไปจะเป็น
กรองออก จำนวนเต็มเกณฑ์ที่กำหนดว่าไซต์ถูกกรองหรือไม่เป็น
ตั้งค่าโดยใช้ตัวเลือก --mask-min ซึ่งมีค่าเริ่มต้นเป็น 0 โครโมโซมที่มีอยู่ใน
ไฟล์มาสก์ต้องจัดเรียงในลำดับเดียวกับไฟล์ VCF ตัวเลือก --mask
ใช้เพื่อระบุไฟล์มาสก์ที่จะใช้ในขณะที่ --invert-mask ตัวเลือกสามารถ
ใช้เพื่อระบุไฟล์มาสก์ที่จะกลับด้านก่อนนำไปใช้

บุคคล ฟิลเตอร์
--indv
ระบุบุคคลที่จะเก็บไว้ในการวิเคราะห์ ตัวเลือกนี้สามารถใช้ได้หลายรายการ
ครั้งเพื่อระบุบุคคลหลายคน

--เก็บไว้
จัดเตรียมไฟล์ที่มีรายชื่อบุคคลที่จะรวมไว้ในการวิเคราะห์ในภายหลัง
แต่ละ ID (ตามที่กำหนดไว้ในหัวข้อ VCF) ควรรวมอยู่ในa
แยกสาย.

--remove-indv
ระบุบุคคลที่จะลบออกจากการวิเคราะห์ สามารถใช้ตัวเลือกนี้ได้
หลายครั้งเพื่อระบุบุคคลหลายคน หากตัวเลือก --indv เป็น
ระบุ จากนั้นตัวเลือก --indv จะถูกดำเนินการก่อน --remove-indv ตัวเลือก

--ลบ
จัดเตรียมไฟล์ที่มีรายชื่อบุคคลที่จะไม่รวมในการวิเคราะห์ในภายหลัง
แต่ละ ID (ตามที่กำหนดไว้ในหัวข้อ VCF) ควรรวมอยู่ในa
แยกสาย. หากใช้ทั้งตัวเลือก --keep และ --remove แสดงว่า
--keep ตัวเลือกจะดำเนินการก่อน --remove ตัวเลือก

--จันทร์-indv-meanDP

--max-indv-meanDP
คำนวณความครอบคลุมเฉลี่ยเป็นรายบุคคล เฉพาะบุคคลที่มี
ความครอบคลุมภายในช่วงที่ระบุโดยตัวเลือกเหล่านี้จะรวมอยู่ในภายหลัง
วิเคราะห์

--จิตใจ
ระบุเกณฑ์อัตราการโทรขั้นต่ำสำหรับแต่ละบุคคล

--เฟส
อันดับแรก ไม่รวมบุคคลทั้งหมดที่มีจีโนไทป์ทั้งหมดที่ไม่มีการแบ่งระยะ และต่อมา
ไม่รวมไซต์ทั้งหมดที่มีจีโนไทป์ที่ไม่แบ่งระยะ ข้อมูลที่เหลือจึงประกอบด้วย
ของข้อมูลที่แบ่งเป็นระยะเท่านั้น

แบบฉบับของตระกูล ฟิลเตอร์
--remove-กรอง-geno-all

--remove-กรอง-geno
ตัวเลือกแรกจะลบจีโนไทป์ทั้งหมดที่มีแฟล็ก FILTER ทางเลือกที่สองคือ
ใช้เพื่อแยกจีโนไทป์ที่มีแฟล็กตัวกรองเฉพาะ

--minGQ
ยกเว้นจีโนไทป์ทั้งหมดที่มีคุณภาพต่ำกว่าเกณฑ์ที่ระบุโดยตัวเลือกนี้
(จีคิว).

--minDP
ยกเว้นจีโนไทป์ทั้งหมดที่มีความลึกของลำดับด้านล่างที่ระบุโดยตัวเลือกนี้
(ดีพี)

เอาท์พุต สถิติ
--ความถี่

--นับ

--ความถี่2

--นับ2
เอาท์พุทข้อมูลความถี่ต่อไซต์ --freq ส่งออกความถี่อัลลีลใน a
ไฟล์ที่มีส่วนต่อท้าย '.frq' ตัวเลือก --counts ส่งออกไฟล์ที่คล้ายกันด้วย
คำต่อท้าย '.frq.count' ที่มีจำนวนอัลลีลดิบในแต่ละไซต์ ที่ --freq2
และ --count2 ตัวเลือกใช้เพื่อระงับข้อมูลอัลลีลในไฟล์เอาต์พุต ใน
ในกรณีนี้ ลำดับของความถี่/จำนวนขึ้นอยู่กับการนับในไฟล์ VCF

--ความลึก
สร้างไฟล์ที่มีความลึกเฉลี่ยต่อบุคคล ไฟล์นี้มีคำต่อท้าย
'.ไอลึก'.

--ไซต์ความลึก

--ไซต์-ค่าเฉลี่ย-ความลึก
สร้างไฟล์ที่มีความลึกต่อไซต์ ตัวเลือก --site-deep แสดงผล
ความลึกของแต่ละไซต์โดยสรุปเป็นรายบุคคล ไฟล์นี้มีคำต่อท้าย '.ldeep'
ในทำนองเดียวกัน --site-mean-degree แสดงความลึกเฉลี่ยสำหรับแต่ละไซต์และ
ไฟล์เอาต์พุตมีส่วนต่อท้าย '.ldepth.mean'

--geno-เชิงลึก
สร้างไฟล์ (อาจมีขนาดใหญ่มาก) ที่มีความลึกสำหรับแต่ละจีโนไทป์ใน
ไฟล์ VCF รายการที่ขาดหายไปจะได้รับค่า -1 ไฟล์มีคำต่อท้าย
'.gdeep'.

--ไซต์คุณภาพ
สร้างไฟล์ที่มีคุณภาพ SNP ต่อไซต์ ตามที่พบในคอลัมน์ QUAL
ของไฟล์ VCF ไฟล์นี้มีคำต่อท้าย '.lqual'

--เฮท คำนวณการวัดค่า heterozygosity แบบรายบุคคล โดยเฉพาะ
ค่าสัมประสิทธิ์การผสมพันธุ์ F ถูกประมาณสำหรับแต่ละบุคคลโดยใช้วิธี
ช่วงเวลา ไฟล์ผลลัพธ์มีคำต่อท้าย '.het'

--บึกบึน
รายงานค่า p สำหรับแต่ละไซต์จากการทดสอบ Hardy-Weinberg Equilibrium (ตามที่กำหนดไว้
โดย Wigginton, Cutler และ Abecasis (2005)) ไฟล์ผลลัพธ์ (พร้อมคำต่อท้าย '.hwe')
ยังมีจำนวนที่สังเกตได้ของ Homozygotes และ Heterozygotes และ
ตัวเลขที่คาดหวังที่สอดคล้องกันภายใต้ HWE

--หายไป
สร้างสองไฟล์ที่รายงานการสูญหายในแต่ละบุคคลและต่อไซต์
พื้นฐาน ทั้งสองไฟล์มีส่วนต่อท้าย '.imiss' และ '.lmiss' ตามลำดับ

--hap-r2

--เจโน-r2

--ld-หน้าต่าง

--ld-window-bp

--นาที-r2
ตัวเลือกเหล่านี้ใช้เพื่อรายงานสถิติการเชื่อมโยงความไม่สมดุล (LD) เป็น
สรุปโดยสถิติ r2 ตัวเลือก --hap-r2 แจ้ง vcftools ให้ส่งออก a
ไฟล์การรายงานสถิติ r2 โดยใช้ haplotypes แบบแบ่งเฟส นี่คือประเพณี
การวัด LD ที่มักรายงานในวรรณคดีพันธุศาสตร์ของประชากร ถ้าจะค่อย ๆ
haplotypes ไม่พร้อมใช้งานดังนั้นอาจใช้ตัวเลือก --geno-r2 ซึ่งคำนวณ
ค่าสัมประสิทธิ์สหสัมพันธ์กำลังสองระหว่างจีโนไทป์ที่เข้ารหัสเป็น 0, 1 และ 2 ถึง
แสดงถึงจำนวนอัลลีลที่ไม่อ้างอิงในแต่ละบุคคล นี่ก็เหมือนกัน
ตามมาตรการ LD ที่รายงานโดย PLINK เวอร์ชัน haplotype ส่งออกไฟล์ด้วย
คำต่อท้าย '.hap.ld' ในขณะที่เวอร์ชันจีโนไทป์จะส่งออกไฟล์ที่มีส่วนต่อท้าย
'.geno.ld' เวอร์ชัน haplotype แสดงถึงตัวเลือก --phased

ตัวเลือก --ld-window กำหนดการแยก SNP สูงสุดสำหรับการคำนวณ
แอล.ดี. ในทำนองเดียวกัน ตัวเลือก --ld-window-bp สามารถใช้เพื่อกำหนดฟิสิคัลสูงสุดได้
การแยก SNPs ที่รวมอยู่ในการคำนวณ LD ในที่สุด --min-r2 ตั้งค่า a
ค่าต่ำสุดสำหรับ r2 ด้านล่างซึ่งไม่ได้รายงานสถิติ LD

--SNPdnsity
คำนวณจำนวนและความหนาแน่นของ SNP ในถังขยะขนาดที่กำหนดโดยตัวเลือกนี้
ไฟล์ผลลัพธ์ที่ได้มีคำต่อท้าย '.snpden'

--ทีเอสทีวี
คำนวณอัตราส่วนการเปลี่ยนภาพ / การแปลงเป็นช่องขนาดที่กำหนดโดยสิ่งนี้
ตัวเลือก. ไฟล์ผลลัพธ์ที่ได้มีคำต่อท้าย '.TsTv' สรุปก็คือ
ให้มาในไฟล์ที่มีคำต่อท้าย '.TsTv.summary'

--กรอง-สรุป
สร้างสรุปจำนวน SNP และอัตราส่วน Ts/Tv สำหรับแต่ละหมวดตัวกรอง
ไฟล์เอาต์พุตมีส่วนต่อท้าย '.FILTER.summary

--กรองไซต์
สร้างสองไฟล์ที่มีรายชื่อไซต์ที่ถูกเก็บหรือลบออกหลังจากการกรอง NS
ไฟล์แรกพร้อมคำต่อท้าย '.kept.sites' แสดงรายการไซต์ที่ vcftools เก็บไว้หลังตัวกรอง
ได้ถูกนำไปใช้ ไฟล์ที่สองที่มีส่วนต่อท้าย '.removed.sites' แสดงรายการไซต์
ลบโดยตัวกรองที่ใช้

--ซิงเกิลตัน
ตัวเลือกนี้จะสร้างไฟล์ที่มีรายละเอียดตำแหน่งของซิงเกิลตันและ
แต่ละรายการที่เกิดขึ้น ไฟล์รายงานทั้ง singletons จริงและส่วนตัว
doubletons (เช่น SNPs ที่อัลลีลรองเกิดขึ้นเพียงคนเดียวและ
บุคคลนั้นเป็นโฮโมไซโกติกสำหรับอัลลีลนั้น) ไฟล์ที่ส่งออกมีคำต่อท้าย
'.ซิงเกิ้ลตัน'.

--site-pi

--window-pi
ตัวเลือกเหล่านี้ใช้เพื่อประเมินระดับความหลากหลายของนิวคลีโอไทด์ ตัวเลือกแรก
ทำสิ่งนี้ตามไซต์ และไฟล์ผลลัพธ์มีคำต่อท้าย '.sites.pi' NS
ตัวเลือกที่สองคำนวณความหลากหลายของนิวคลีโอไทด์ในหน้าต่างด้วยขนาดหน้าต่าง
กำหนดไว้ในอาร์กิวเมนต์ตัวเลือก เอาต์พุตสำหรับตัวเลือกนี้มีคำต่อท้าย
'.window.pi'. เวอร์ชันที่มีหน้าต่างต้องการข้อมูลที่แบ่งเป็นระยะ และด้วยเหตุนี้จึงใช้สิ่งนี้
option หมายถึงตัวเลือก --phased

เอาท์พุต in อื่นๆ รูปแบบ
--O12 ตัวเลือกนี้แสดงผลจีโนไทป์เป็นเมทริกซ์ขนาดใหญ่ มีการผลิตไฟล์สามไฟล์ NS
อันดับแรก ด้วยคำต่อท้าย '.012' มีจีโนไทป์ของแต่ละคนแยกจากกัน
ไลน์. จีโนไทป์แสดงเป็น 0, 1 และ 2 โดยที่ตัวเลขแทนค่านั้น
จำนวนอัลลีลที่ไม่อ้างอิง จีโนไทป์ที่หายไปจะแสดงด้วย -1 NS
ไฟล์ที่สองพร้อมส่วนต่อท้าย '.012.indv' ให้รายละเอียดบุคคลที่รวมอยู่ในไฟล์หลัก
ไฟล์. ไฟล์ที่สามที่มีส่วนต่อท้าย '.012.pos' ให้รายละเอียดตำแหน่งของไซต์ที่รวมอยู่ใน
ไฟล์หลัก

--ผลกระทบ
ตัวเลือกนี้จะแสดงผล haplotypes แบบค่อยเป็นค่อยไปในรูปแบบแผงอ้างอิงของ IMPUTE เป็น IMPUTE
ต้องการข้อมูลที่แบ่งเป็นระยะ การใช้ตัวเลือกนี้ยังหมายถึง --phased Unphased
บุคคลและจีโนไทป์จึงถูกยกเว้น เฉพาะไซต์ไบอัลเลลิกเท่านั้น
รวมอยู่ในผลลัพธ์ การใช้ตัวเลือกนี้จะสร้างไฟล์สามไฟล์ อิมพีท
ไฟล์ haplotype มีคำต่อท้าย '.impute.hap' และไฟล์คำอธิบาย IMPUTE มี
คำต่อท้าย '.impute.hap.legend' ไฟล์ที่สาม มีคำต่อท้าย '.impute.hap.indv'
ให้รายละเอียดบุคคลที่รวมอยู่ในไฟล์ haplotype แม้ว่าไฟล์นี้จะไม่ใช่
จำเป็นโดย IMPUTE

--หมวก

--ldhat-geno
ตัวเลือกเหล่านี้จะส่งออกข้อมูลในรูปแบบ LDhat การใช้ตัวเลือกเหล่านี้จำเป็นต้องมี
--chr ตัวเลือกโดยใช้ ตัวเลือก --ldhat จะแสดงผลข้อมูลที่แบ่งเป็นระยะเท่านั้น ดังนั้น
ยังหมายความถึง --phased ซึ่งนำไปสู่บุคคล unphased และ genotypes เป็น
ยกเว้น อีกทางหนึ่ง --ldhat-geno ตัวเลือกจะถือว่าข้อมูลทั้งหมดเป็น
unphased และส่งออกไฟล์ LDhat ในรูปแบบ genotype/unphased ไม่ว่าใน
กรณี สองไฟล์ถูกสร้างขึ้นด้วยคำต่อท้าย '.ldhat.sites' และ '.ldhat.locs'
ซึ่งสอดคล้องกับไฟล์อินพุต 'sites' และ 'locs' ของ LDhat ตามลำดับ

--บีเกิ้ล-GL
ตัวเลือกนี้จะแสดงข้อมูลความน่าจะเป็นของจีโนไทป์สำหรับการป้อนข้อมูลลงใน BEAGLE
โปรแกรม. ตัวเลือกนี้กำหนดให้ไฟล์ VCF มีแท็ก FORMAT GL ซึ่งสามารถ
โดยทั่วไปจะถูกส่งออกโดยผู้โทร SNP เช่น GATK การใช้ตัวเลือกนี้ต้องใช้ a
โครโมโซมที่จะระบุผ่านตัวเลือก --chr ไฟล์ผลลัพธ์ที่ได้ (ด้วย
คำต่อท้าย '.BEAGLE.GL') มีความน่าจะเป็นของยีนสำหรับไซต์ที่มีคู่แฝดและเป็น
เหมาะสำหรับการป้อนข้อมูลใน BAGLE ผ่านอาร์กิวเมนต์ 'like='

--ปลั๊ก
ตัวเลือกนี้จะแสดงข้อมูลจีโนไทป์ในรูปแบบ PLINK PED สองไฟล์ถูกสร้างขึ้น
ด้วยคำต่อท้าย '.ped' และ '.map' โปรดทราบว่าจะแสดงเฉพาะตำแหน่งไบอัลเลลิกเท่านั้น
รายละเอียดเพิ่มเติมของไฟล์เหล่านี้สามารถพบได้ในเอกสาร PLINK

หมายเหตุ: ตัวเลือกนี้อาจช้ามากสำหรับชุดข้อมูลขนาดใหญ่ การใช้ตัวเลือก --chr เพื่อ
แนะนำให้แบ่งชุดข้อมูล

--plink-tped
ตัวเลือก --plink ด้านบนอาจทำงานช้ามากสำหรับชุดข้อมูลขนาดใหญ่ ทางเลือก
ที่อาจเร็วกว่ามากคือการส่งออกในรูปแบบ PLINK transposed
สามารถทำได้โดยใช้ตัวเลือก --plink-tped ซึ่งสร้างไฟล์สองไฟล์ด้วย
คำต่อท้าย '.tped' และ '.tfam'

--recode
ตัวเลือก --recode ใช้เพื่อสร้างไฟล์ VCF จากไฟล์ VCF อินพุตที่มี
ใช้ตัวเลือกที่ระบุโดยผู้ใช้ ไฟล์ที่ส่งออกมีคำต่อท้าย
'.recode.vcf'

ตามค่าเริ่มต้น ฟิลด์ INFO จะถูกลบออกจากไฟล์เอาต์พุต เนื่องจากเป็นค่า INFO
อาจทำให้การบันทึกเป็นโมฆะ (เช่น ความลึกทั้งหมดอาจต้อง
คำนวณใหม่หากบุคคลถูกลบออก) ฟังก์ชันเริ่มต้นนี้สามารถ
แทนที่โดยใช้ --keep-INFO ตัวเลือกที่ กำหนด
ปุ่ม INFO เพื่อเก็บไว้ในไฟล์ที่ส่งออก แฟล็ก --keep-INFO สามารถใช้หลายรายการได้
ครั้ง อีกทางหนึ่ง ตัวเลือก --keep-INFO-all สามารถใช้เพื่อเก็บ INFO . ทั้งหมด
เขตข้อมูล

เบ็ดเตล็ด
--extract-FORMAT-ข้อมูล
ดึงข้อมูลจากฟิลด์จีโนไทป์ในไฟล์ VCF ที่เกี่ยวข้องกับ specfied
ตัวระบุรูปแบบ ตัวอย่างเช่น การใช้ตัวเลือก '--extract-FORMAT-info GT' จะ
แยกรายการ GT (เช่น Genotype) ทั้งหมด ไฟล์ผลลัพธ์ที่ได้มี
คำต่อท้าย ' .รูปแบบ'.

--รับข้อมูล
ตัวเลือกนี้ใช้เพื่อดึงข้อมูลจากฟิลด์ INFO ในไฟล์ VCF NS
อาร์กิวเมนต์ระบุแท็ก INFO ที่จะแยกออกและตัวเลือกสามารถเป็น
ใช้หลายครั้งเพื่อแยกรายการข้อมูลหลายรายการ ไฟล์ผลลัพธ์
ด้วยคำต่อท้าย '.INFO' มีข้อมูลที่จำเป็นในแท็บแยก
ตาราง. ตัวอย่างเช่น ในการแยกแฟล็ก NS และ DB หนึ่งจะใช้คำสั่ง:

vcftools --vcf file1.vcf --get-INFO NS --get-INFO ฐานข้อมูล

VCF เนื้อไม่มีมัน การเปรียบเทียบ Options
ขณะนี้ตัวเลือกการเปรียบเทียบไฟล์อยู่ในสถานะฟลักซ์และมีแนวโน้มว่าจะมีปัญหา ถ้าคุณ
พบข้อผิดพลาดโปรดรายงาน โปรดทราบว่าตัวกรองระดับจีโนไทป์ไม่ได้รับการสนับสนุนในสิ่งเหล่านี้
ตัวเลือก

--ความแตกต่าง

--gzdiff
เลือกไฟล์ VCF เพื่อเปรียบเทียบกับไฟล์ที่ระบุโดยตัวเลือก --vcf
ส่งออกไฟล์สองไฟล์ที่อธิบายไซต์และบุคคลทั่วไป / ไม่ซ้ำกันสำหรับแต่ละไฟล์
ไฟล์. ไฟล์เหล่านี้มีส่วนต่อท้าย '.diff.sites_in_files' และ
'.diff.indv_in_files' ตามลำดับ เวอร์ชัน --gzdiff สามารถใช้อ่านได้
ไฟล์ VCF ที่บีบอัด

--diff-ไซต์-ความไม่ลงรอยกัน
ใช้ร่วมกับตัวเลือก --diff เพื่อคำนวณความไม่ลงรอยกันบนไซต์โดย
พื้นฐานเว็บไซต์ ไฟล์ผลลัพธ์ที่ได้มีคำต่อท้าย '.diff.sites'

--diff-indv-ความไม่ลงรอยกัน
ใช้ร่วมกับตัวเลือก --diff เพื่อคำนวณความไม่ลงรอยกันต่อ
พื้นฐานส่วนบุคคล ไฟล์ผลลัพธ์ที่ได้มีคำต่อท้าย '.diff.indv'

--diff-discordance-เมทริกซ์
ใช้ร่วมกับตัวเลือก --diff เพื่อคำนวณเมทริกซ์ความไม่ลงรอยกัน นี้
ตัวเลือกใช้งานได้เฉพาะกับ bi-allelic loci ที่มีอัลลีลที่ตรงกันที่มีอยู่ใน
ทั้งสองไฟล์ ไฟล์ผลลัพธ์ที่ได้มีคำต่อท้าย '.diff.discordance.matrix'

--diff-switch-ข้อผิดพลาด
ใช้ร่วมกับตัวเลือก --diff เพื่อคำนวณข้อผิดพลาดของเฟส
(โดยเฉพาะ 'ข้อผิดพลาดในการเปลี่ยน') ตัวเลือกนี้สร้างไฟล์เอาท์พุตสองไฟล์ที่อธิบาย
ข้อผิดพลาดของสวิตช์ที่พบระหว่างไซต์ และข้อผิดพลาดของสวิตช์โดยเฉลี่ยต่อบุคคล
สองไฟล์นี้มีคำต่อท้าย '.diff.switch' และ '.diff.indv.switch'
ตามลำดับ

Options ยังคง in พัฒนาการ
ตัวเลือกต่อไปนี้ยังไม่เสร็จสิ้น มีแนวโน้มว่าจะมีข้อบกพร่อง และมีแนวโน้มว่า
เพื่อเปลี่ยนแปลงในอนาคต

--fst

--gzfst
คำนวณ FST สำหรับไฟล์ VCF หนึ่งคู่ โดยไฟล์ที่สองจะถูกระบุโดยไฟล์นี้
ตัวเลือก. ปัจจุบัน FST คำนวณโดยใช้สูตรที่อธิบายไว้ใน
วัสดุเสริมของกระดาษ HapMap Phase I ปัจจุบัน FST แบบคู่เท่านั้น
รองรับการคำนวณ แม้ว่าสิ่งนี้จะมีการเปลี่ยนแปลงในอนาคต NS
--gzfst สามารถใช้เพื่ออ่านไฟล์ VCF ที่บีบอัดได้

--LROH ระบุ Homozygosity ระยะยาว

--ความเกี่ยวข้องกัน
เอาท์พุตสถิติความเกี่ยวข้องส่วนบุคคล

ใช้ vcftools ออนไลน์โดยใช้บริการ onworks.net


เซิร์ฟเวอร์และเวิร์กสเตชันฟรี

ดาวน์โหลดแอพ Windows & Linux

  • 1
    Firebird
    Firebird
    Firebird RDBMS นำเสนอคุณสมบัติ ANSI SQL
    & ทำงานบน Linux, Windows &
    หลายแพลตฟอร์ม Unix คุณสมบัติ
    การทำงานพร้อมกันและประสิทธิภาพที่ยอดเยี่ยม
    & พลัง...
    ดาวน์โหลด Firebird
  • 2
    Kompozer
    Kompozer
    KompoZer เป็นโปรแกรมแก้ไข HTML wysiwyg โดยใช้
    ฐานโค้ด Mozilla Composer เนื่องจาก
    การพัฒนาของ Nvu ถูกหยุดลง
    ในปี 2005 KompoZer แก้ไขข้อบกพร่องมากมายและ
    เพิ่มเ...
    ดาวน์โหลดโปรแกรม KompoZer
  • 3
    ดาวน์โหลดมังงะฟรี
    ดาวน์โหลดมังงะฟรี
    The Free Manga Downloader (FMD) เป็น
    แอปพลิเคชันโอเพ่นซอร์สที่เขียนใน
    Object-Pascal สำหรับการจัดการและ
    ดาวน์โหลดมังงะจากเว็บไซต์ต่างๆ
    นี่คือกระจก...
    ดาวน์โหลด Manga Downloader ฟรี
  • 4
    Aetbootin
    Aetbootin
    UNetbootin ช่วยให้คุณสร้างบูตได้
    ไดรฟ์ USB สดสำหรับ Ubuntu, Fedora และ
    การกระจาย Linux อื่น ๆ ที่ไม่มี
    เขียนซีดี มันทำงานบน Windows, Linux,
    และ ...
    ดาวน์โหลด UNetbootin
  • 5
    โดลิบาร์ ERP - CRM
    โดลิบาร์ ERP - CRM
    Dolibarr ERP - CRM ใช้งานง่าย
    แพ็คเกจซอฟต์แวร์โอเพ่นซอร์ส ERP และ CRM
    (รันด้วยเว็บเซิร์ฟเวอร์ php หรือ as
    ซอฟต์แวร์แบบสแตนด์อโลน) สำหรับธุรกิจ
    ฐานราก...
    ดาวน์โหลด Dolibarr ERP - CRM
  • 6
    ไคลเอนต์ sqirreL SQL
    ไคลเอนต์ sqirreL SQL
    SQuirreL SQL Client คือ SQL . แบบกราฟิก
    ไคลเอนต์ที่เขียนด้วย Java ที่จะอนุญาต
    ให้คุณดูโครงสร้างของ JDBC
    ฐานข้อมูลที่สอดคล้อง เรียกดูข้อมูลใน
    โต๊ะ...
    ดาวน์โหลดไคลเอนต์ sqirreL SQL
  • เพิ่มเติม»

คำสั่ง Linux

Ad