นี่คือคำสั่ง bgzip ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
bgzip - ยูทิลิตี้บีบอัด/คลายการบีบอัดบล็อก
tabix - ตัวสร้างดัชนีทั่วไปสำหรับไฟล์ตำแหน่งจีโนมที่คั่นด้วย TAB
เรื่องย่อ
บีจีซิป [-cdhB] [-b เสมือนออฟเซ็ต] [-s ขนาด] [ไฟล์]
ทาบิกซ์ [-0ล] [-p gff|เตียง|แซม|vcf] [-s seqCol] [-b ขอCol] [-e จบ พ] [-S บรรทัดข้าม] [-c
เมตาชาร์] in.tab.bgz [ภูมิภาค 1 [ภูมิภาค 2 [...-
DESCRIPTION
Tabix จัดทำดัชนีไฟล์ตำแหน่งจีโนมที่คั่นด้วย TAB in.tab.bgz และสร้างไฟล์ดัชนี (
in.tab.bgz.tbi or in.tab.bgz.csi ) เมื่อไหร่ ภูมิภาค หายไปจากบรรทัดคำสั่ง อินพุต
ไฟล์ข้อมูลต้องเรียงตำแหน่งและบีบอัดโดย บีจีซิป ซึ่งมี gzip(1) ชอบ
อินเตอร์เฟซ. หลังจากสร้างดัชนีแล้ว tabix จะสามารถดึงข้อมูลสายข้อมูลที่ทับซ้อนกันได้อย่างรวดเร็ว
ภูมิภาค ระบุในรูปแบบ "chr:beginPos-endPos" การดึงข้อมูลอย่างรวดเร็วยังได้ผลมากกว่า
เครือข่าย ถ้า URI ถูกกำหนดเป็นชื่อไฟล์ และในกรณีนี้ ไฟล์ดัชนีจะถูกดาวน์โหลด
หากไม่มีอยู่ในท้องถิ่น
การทำดัชนี OPTIONS
-0, --ศูนย์ตาม
ระบุว่าตำแหน่งในไฟล์ข้อมูลเป็นแบบ 0 (เช่น ไฟล์ UCSC) แทน
มากกว่า 1 ตาม
-NS, --เริ่ม INT
คอลัมน์ของตำแหน่งโครโมโซมเริ่มต้น [4]
-ค, --ความคิดเห็น ชาร์
ข้ามบรรทัดที่ขึ้นต้นด้วยอักขระ CHAR [#]
-ค, --csi ข้ามบรรทัดที่ขึ้นต้นด้วยอักขระ CHAR [#]
-e, --จบ INT
คอลัมน์ของตำแหน่งโครโมโซมปลาย คอลัมน์สิ้นสุดสามารถเหมือนกับจุดเริ่มต้น
คอลัมน์. [5]
-NS, --บังคับ
บังคับให้เขียนทับไฟล์ดัชนีหากมีอยู่
-NS, --นาที-กะINT
กำหนดขนาดช่วงขั้นต่ำสำหรับดัชนี CSI เป็น 2^INT [14]
-NS, --ที่ตั้งไว้ล่วงหน้า STR
รูปแบบอินพุตสำหรับการจัดทำดัชนี ค่าที่ถูกต้องคือ: gff, bed, sam, vcf ตัวเลือกนี้
ไม่ควรใช้ร่วมกับ -s, -b, -e, -c และ -0; ไม่ได้ใช้
สำหรับการดึงข้อมูลเนื่องจากการตั้งค่านี้จัดเก็บไว้ในไฟล์ดัชนี [gff]
-NS, --ลำดับ INT
คอลัมน์ของชื่อลำดับ ตัวเลือก -s, -b, -e, -S, -c และ -0 ทั้งหมดถูกเก็บไว้ใน
ไฟล์ดัชนีจึงไม่ใช้ในการดึงข้อมูล [1]
-NS, --ข้ามบรรทัด INT
ข้ามบรรทัด INT แรกในไฟล์ข้อมูล [0]
การสอบถาม AND อื่น ๆ OPTIONS
-ชม, --หัวพิมพ์
พิมพ์ส่วนหัว/บรรทัดเมตาด้วย
-ชม, --เฉพาะส่วนหัว
พิมพ์เฉพาะส่วนหัว/บรรทัดเมตา
-ผม, --file-ข้อมูล
พิมพ์ข้อมูลรูปแบบไฟล์
-l --list-chroms
แสดงรายการชื่อลำดับที่จัดเก็บไว้ในไฟล์ดัชนี
-NS, --หัวเรื่อง ไฟล์
แทนที่ส่วนหัวด้วยเนื้อหาของ FILE
-NS, --ภูมิภาค ไฟล์
จำกัดเฉพาะภูมิภาคที่ระบุไว้ในไฟล์ ไฟล์สามารถเป็นไฟล์ BED (ต้องมี .bed,
.bed.gz, .bed.bgz นามสกุลไฟล์) หรือไฟล์ที่คั่นด้วย TAB ด้วย CHROM, POS,
และคอลัมน์ POS_TO หรือไม่ก็ได้ โดยที่ตำแหน่งเป็นแบบ 1 และรวมอยู่ด้วย เมื่อไหร่
ตัวเลือกนี้กำลังใช้งานอยู่ ไฟล์อินพุตอาจไม่สามารถจัดเรียงได้ ภูมิภาค
-NS, --เป้าหมาย ไฟล์
คล้ายกับ -R แต่ข้อมูลที่ป้อนทั้งหมดจะถูกอ่านตามลำดับและภูมิภาคไม่อยู่ในรายการ
ใน FILE จะถูกข้าม
ตัวอย่าง
(grep ^"#" in.gff; grep -v ^"#" in.gff | sort -k1,1 -k4,4n) | bgzip > sorted.gff.gz;
tabix -p gff sorted.gff.gz;
tabix sorted.gff.gz chr1:10,000,000-20,000,000;
หมายเหตุ
เป็นการตรงไปตรงมาเพื่อให้ได้การสืบค้นที่ทับซ้อนกันโดยใช้ดัชนี B-tree มาตรฐาน (ด้วย or
โดยไม่ต้อง binning) นำไปใช้กับฐานข้อมูล SQL ทั้งหมดหรือดัชนี R-tree ใน PostgreSQL และ
ออราเคิล. แต่ยังมีเหตุผลมากมายที่จะใช้ tabix ประการแรก tabix ทำงานโดยตรงกับ
รูปแบบที่คั่นด้วย TAB ที่ใช้กันอย่างแพร่หลาย เช่น GFF/GTF และ BED เราไม่จำเป็นต้อง
ออกแบบสคีมาฐานข้อมูลหรือรูปแบบไบนารีเฉพาะ ข้อมูลไม่จำเป็นต้องทำซ้ำใน
รูปแบบที่แตกต่างกันอย่างใดอย่างหนึ่ง ประการที่สอง tabix ทำงานบนไฟล์ข้อมูลที่บีบอัดในขณะที่SQL .ส่วนใหญ่
ฐานข้อมูลไม่ได้ GTF คำอธิบายประกอบ GenCode สามารถบีบอัดได้ถึง 4% ประการที่สาม tabix
รวดเร็ว เป็นที่ทราบกันดีว่าอัลกอริทึมการจัดทำดัชนีเดียวกันทำงานอย่างมีประสิทธิภาพสำหรับการจัดตำแหน่งด้วย a
อ่านสั้น ๆ ไม่กี่พันล้าน ฐานข้อมูล SQL อาจไม่สามารถจัดการข้อมูลในระดับนี้ได้อย่างง่ายดาย
สุดท้ายแต่ไม่ท้ายสุด tabix รองรับการดึงข้อมูลระยะไกล หนึ่งสามารถใส่ไฟล์ข้อมูล
และดัชนีที่เซิร์ฟเวอร์ FTP หรือ HTTP และผู้ใช้รายอื่นหรือแม้แต่บริการเว็บจะสามารถ
เพื่อรับสไลซ์โดยไม่ต้องดาวน์โหลดไฟล์ทั้งหมด
ใช้ bgzip ออนไลน์โดยใช้บริการ onworks.net