EnglishFrenchGermanItalianPortugueseRussianSpanish

ไอคอน Fav ของ OnWorks

maq - ออนไลน์ในคลาวด์

เรียกใช้ maq ในผู้ให้บริการโฮสต์ฟรีของ OnWorks ผ่าน Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

นี่คือคำสั่ง maq ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

โครงการ:

ชื่อ


Maq - การทำแผนที่และการประกอบด้วยคุณภาพ

เรื่องย่อ


MAQ คำสั่ง [ตัวเลือก] ข้อโต้แย้ง

maq.pl คำสั่ง [ตัวเลือก] ข้อโต้แย้ง

DESCRIPTION


Maq เป็นซอฟต์แวร์ที่สร้างแอสเซมบลีการทำแผนที่จากการอ่านสั้นๆ ที่สร้างขึ้นโดย
เครื่องเรียงลำดับการสร้าง ได้รับการออกแบบมาโดยเฉพาะสำหรับ Illumina-Solexa 1G Genetic
วิเคราะห์และมีฟังก์ชันเบื้องต้นในการจัดการข้อมูล AB SOLiD

ด้วย Maq คุณสามารถ:

· Fast align Illumina/SOLiD อ่านจีโนมอ้างอิง ด้วยตัวเลือกเริ่มต้น one
สามารถจับคู่การอ่านล้านคู่กับจีโนมมนุษย์ในเวลาประมาณ 10 ชั่วโมงของ CPU โดยใช้เวลาน้อยกว่า
กว่าหน่วยความจำ 1G

· วัดความน่าจะเป็นของข้อผิดพลาดของการจัดตำแหน่งการอ่านแต่ละครั้งอย่างแม่นยำ

· เรียกจีโนไทป์ที่เป็นเอกฉันท์ รวมทั้งพหุสัณฐานแบบโฮโมไซกัสและเฮเทอโรไซกัสด้วย
คุณภาพความน่าจะเป็นของ Phred ที่กำหนดให้กับแต่ละฐาน

· ค้นหาอินเดลสั้น ๆ ที่มีการอ่านปลายคู่

· ค้นหาการลบจีโนมขนาดใหญ่และการโยกย้ายอย่างแม่นยำด้วยการอ่านปลายคู่

· ค้นพบ CNV ที่อาจเกิดขึ้นโดยการตรวจสอบความลึกในการอ่าน

· ประเมินความถูกต้องของคุณภาพฐานดิบจากซีเควนเซอร์และช่วยตรวจสอบ
ข้อผิดพลาดอย่างเป็นระบบ

อย่างไรก็ตาม Maq can ไม่:

· ทำ de โนโว การประกอบ. (Maq สามารถเรียกฉันทามติได้โดยการทำแผนที่อ่านไปยังที่รู้จัก
อ้างอิง.)

·กางเกงขาสั้นแผนที่อ่านกับตัวเอง (Maq สามารถค้นหาการทับซ้อนที่สมบูรณ์ระหว่างการอ่านเท่านั้น)

· จัดตำแหน่งการอ่านของเส้นเลือดฝอยหรือ 454 อ่านค่าอ้างอิง (Maq ไม่สามารถจัดแนวอ่านได้นานกว่า
63bp.)

MAQ คำสั่ง


คีย์ คำสั่ง

fasta2bfa MAQ fasta2bfa in.ref.fasta out.ref.bfa

แปลงลำดับในรูปแบบ FASTA เป็นรูปแบบ BFA ของ Maq (FASTA ไบนารี)

fastq2bfq MAQ fastq2bfq [-n nreads] in.read.fastq out.read.bfqout.prefix

แปลงการอ่านในรูปแบบ FASTQ เป็นรูปแบบ BFQ ของ Maq (ไบนารี FASTQ)

ตัวเลือก:

-n INT จำนวนการอ่านต่อไฟล์ [ไม่ระบุ]

แผนที่ MAQ แผนที่ [-n นมิส] [-a maxins] [-c] [-1 len1] [-2 len2] [-d adap3] [-m กลายพันธุ์]
[-u ไม่ได้แมป] [-e maxerr] [-M c⎪g] [-N] [-H allhits] [-C maxhits] out.aln.map
in.ref.bfa in.read1.bfq [in.read2.bfq] 2> out.map.log

แผนที่อ่านไปยังลำดับการอ้างอิง

ตัวเลือก:

-n INT จำนวนไม่ตรงกันสูงสุดที่สามารถพบได้ตลอดเวลา [2]

-a INT ระยะห่างภายนอกสูงสุดสำหรับคู่การอ่านที่ถูกต้อง [250]

-A INT ระยะภายนอกสูงสุดของสอง RF จ่ายที่อ่าน (0 สำหรับการปิดใช้งาน) [0]

-c แผนที่อ่านในปริภูมิสี (สำหรับ SOLiD เท่านั้น)

-1 INT ความยาวของการอ่านครั้งแรก 0 สำหรับอัตโนมัติ [0]

-2 INT อ่านความยาวสำหรับการอ่านครั้งที่สอง 0 สำหรับอัตโนมัติ [0]

-m ลอย อัตราการกลายพันธุ์ระหว่างลำดับอ้างอิงและการอ่าน [0.001]

-d ไฟล์ ระบุไฟล์ที่มีลำดับ 3'-adapter บรรทัดเดียว
[โมฆะ]

-u ไฟล์ ดัมพ์การอ่านและการอ่านที่ไม่ได้แมปที่มีมากกว่า นมิส ไม่ตรงกับ
ไฟล์แยกต่างหาก [null]

-e INT เกณฑ์ผลรวมของคุณสมบัติพื้นฐานที่ไม่ตรงกัน [70]

-H ไฟล์ ดัมพ์หลายรายการ/ทั้งหมด 01 รายการที่ไม่ตรงกันไปที่ ไฟล์ [โมฆะ]

-C INT จำนวน Hit สูงสุดที่จะส่งออก ไม่จำกัดถ้ามากกว่า 512. [250]

-M โหมดการจัดตำแหน่งเมทิลเลชั่น c⎪g C (หรือ G) ทั้งหมดบนเกลียวไปข้างหน้าจะเป็น
เปลี่ยนเป็น T (หรือ A) ตัวเลือกนี้ใช้สำหรับการทดสอบเท่านั้น

-N เก็บตำแหน่งที่ไม่ตรงกันในไฟล์เอาต์พุต out.aln.map. เมื่อเป็นเช่นนี้
ใช้งานตัวเลือกอยู่ ความยาวสูงสุดในการอ่านคือ 55bp

หมายเหตุ:

* การอ่านปลายคู่ควรเตรียมเป็น XNUMX ไฟล์ โดยแต่ละไฟล์จะมีไฟล์
การอ่านจะถูกจัดเรียงในลำดับเดียวกัน นี่หมายถึงการอ่านครั้งที่ k ในครั้งแรก
ไฟล์ถูกจับคู่กับการอ่านครั้งที่ k ในไฟล์ที่สอง การอ่านที่สอดคล้องกัน
ชื่อต้องเหมือนกันจนถึงส่วนท้าย `/1' หรือ `/2' ตัวอย่างเช่น เช่น
อนุญาตให้อ่านชื่อคู่: `EAS1_1_5_100_200/1' และ
`EAS1_1_5_100_200/2' หาง `/ [12]' มักจะสร้างโดย
GAPipeline เพื่อแยกความแตกต่างของปลายทั้งสองเป็นคู่

* ผลลัพธ์เป็นไฟล์ไบนารีที่ถูกบีบอัด มันได้รับผลกระทบจาก endianness

* วิธีที่ดีที่สุดในการรันคำสั่งนี้คือให้อ่านประมาณ 1 ถึง 3 ล้านเป็น
ป้อนข้อมูล. การอ่านมากขึ้นใช้หน่วยความจำมากขึ้น

* ตัวเลือก -n ควบคุมความไวของการจัดตำแหน่ง โดยค่าเริ่มต้น ตีด้วย
สามารถค้นหาไม่ตรงกันได้ถึง 2 รายการเสมอ สูงกว่า -n พบเพลงฮิตมากขึ้นและยัง
ปรับปรุงความถูกต้องของคุณภาพการทำแผนที่ อย่างไรก็ตามทำได้โดยเสียค่าใช้จ่าย
ของความเร็ว

* การจัดแนวที่มีความไม่ตรงกันคุณภาพสูงจำนวนมากควรละทิ้งเป็นเท็จ
การเรียงตัวหรือการปนเปื้อนที่เป็นไปได้ พฤติกรรมนี้ถูกควบคุมโดย option
-e. -e เกณฑ์จะคำนวณโดยประมาณเท่านั้นเนื่องจากคุณสมบัติพื้นฐาน
จะถูกหารด้วย 10 ในขั้นตอนหนึ่งของการจัดตำแหน่ง NS -Q ตัวเลือกใน
รวบรวม คำสั่งกำหนดเกณฑ์อย่างแม่นยำ

* การอ่านคู่หนึ่งกล่าวกันว่าจับคู่อย่างถูกต้องก็ต่อเมื่อ
ปฐมนิเทศคือ FR และระยะห่างภายนอกของคู่มีค่าไม่เกิน
maxins. ไม่มีการจำกัดขนาดเม็ดมีดขั้นต่ำ การตั้งค่านี้คือ
กำหนดโดยอัลกอริธึมการจัดตำแหน่งปลายคู่ที่ใช้ใน Maq ต้องการ
ขนาดเม็ดมีดขั้นต่ำจะทำให้เกิดการจัดตำแหน่งที่ไม่ถูกต้องด้วยสูง
คุณภาพการทำแผนที่ที่ประเมินค่าสูงไป

* ปัจจุบัน คู่การอ่านจากไลบรารีการแทรกแบบยาวของ Illumina/Solexa มีการอ่าน RF
ปฐมนิเทศ. ขนาดเม็ดมีดสูงสุดถูกกำหนดโดยตัวเลือก -A. อย่างไรก็ตาม ยาว-
ไลบรารีการแทรกยังผสมกับการอ่านส่วนแทรกสั้น ๆ เล็กน้อย
คู่ -a ควรตั้งค่าให้ถูกต้องด้วย

* บางครั้ง 5'-end หรือแม้แต่ลำดับ 3'-adapter ทั้งหมดอาจถูกจัดลำดับ
หาก -d ทำให้ Maq กำจัดการปนเปื้อนของอแด็ปเตอร์

* ให้ 2 ล้านอ่านเป็นอินพุต MAQ มักจะใช้หน่วยความจำ 800MB

แผนที่ผสาน MAQ แผนที่ผสาน out.aln.map in.aln1.map in.aln2.map [ ... ]

รวมชุดการจัดตำแหน่งการอ่านเข้าด้วยกัน

หมายเหตุ:

* ตามทฤษฎีแล้ว คำสั่งนี้สามารถรวมการจัดตำแหน่งได้ไม่จำกัดจำนวน อย่างไรก็ตาม as
mapmerge จะอ่านอินพุตทั้งหมดพร้อมกันอาจกด
จำกัดจำนวนไฟล์เปิดสูงสุดที่กำหนดโดยระบบปฏิบัติการ ปัจจุบันนี้
จะต้องได้รับการแก้ไขด้วยตนเองโดยผู้ใช้ปลายทาง

* สั่งการ แผนที่ผสาน สามารถใช้เพื่อรวมไฟล์การจัดตำแหน่งด้วย read . ที่แตกต่างกัน
ความยาว การวิเคราะห์ที่ตามมาทั้งหมดจะไม่ถือว่ามีความยาวคงที่อีกต่อไป

rmdup MAQ rmdup out.rmdup.map in.ori.map

ลบคู่ที่มีพิกัดภายนอกเหมือนกัน โดยหลักการแล้ว จับคู่กับ
พิกัดภายนอกที่เหมือนกันควรเกิดขึ้นไม่บ่อยนัก อย่างไรก็ตาม เนื่องจาก
การขยายสัญญาณในการเตรียมตัวอย่าง ซึ่งเกิดขึ้นบ่อยกว่าโดย
โอกาส. การวิเคราะห์เชิงปฏิบัติแสดงให้เห็นว่าการลบรายการที่ซ้ำกันช่วยปรับปรุง
ความแม่นยำโดยรวมของการโทร SNP

รวบรวม MAQ รวบรวม [-sp] [-m maxmis] [-Q maxerr] [-r hetrate] [-t coef] [-q นาทีQ] [-N
ฮับ] out.cns in.ref.bfa in.aln.map 2> out.cns.log

เรียกลำดับฉันทามติจากการอ่านแผนที่

ตัวเลือก:

-t ลอย ค่าสัมประสิทธิ์การพึ่งพาข้อผิดพลาด [0.93]

-r ลอย เศษส่วนของเฮเทอโรไซโกตในทุกไซต์ [0.001]

-s ใช้คุณภาพการทำแผนที่ด้านเดียวเป็นคุณภาพการทำแผนที่ขั้นสุดท้าย
มิฉะนั้นคุณภาพการสิ้นสุดการจับคู่จะถูกใช้

-p ละทิ้งการอ่านสิ้นสุดที่จับคู่ที่ไม่ได้แมปในคู่ที่ถูกต้อง

-m INT จำนวนไม่ตรงกันสูงสุดที่อนุญาตสำหรับการอ่านที่จะใช้ใน
การเรียกร้องฉันทามติ [7]

-Q INT ผลรวมค่าคุณภาพสูงสุดของเบสที่ไม่ตรงกัน [60]

-q INT คุณภาพการทำแผนที่ขั้นต่ำที่อนุญาตสำหรับการอ่านเพื่อใช้เป็นเอกฉันท์
โทร [0]

-N INT จำนวน haplotypes ในสระ (>=2) [2]

หมายเหตุ:

* ตัวเลือก -Q กำหนดขีดจำกัดของผลรวมสูงสุดของคุณภาพฐานที่ไม่ตรงกัน
การอ่านที่มีเนื้อหาไม่ตรงกันคุณภาพสูงจำนวนมากควรละทิ้งไป

* ตัวเลือก -N กำหนดจำนวนของ haplotypes ในพูล มันถูกออกแบบมาสำหรับ
การหาลำดับตัวอย่างใหม่โดยการรวมหลายสายพันธุ์/บุคคลเข้าด้วยกัน สำหรับ
การจัดลำดับจีโนมซ้ำ ตัวเลือกนี้เท่ากับ 2

glfgen MAQ glfgen [-sp] [-m maxmis] [-Q maxerr] [-r hetrate] [-t coef] [-q นาทีQ] [-N
ฮับ] out.cns in.ref.bfa in.aln.map 2> out.cns.log

คำนวณความเป็นไปได้ของบันทึกสำหรับจีโนไทป์ทั้งหมดและเก็บผลลัพธ์ในรูปแบบ GLF
(รูปแบบความน่าจะเป็นของจีโนไทป์) โปรดตรวจสอบเว็บไซต์ MAQ สำหรับรายละเอียด
คำอธิบายของรูปแบบไฟล์และยูทิลิตี้ที่เกี่ยวข้อง

indelpe MAQ indelpe in.ref.bfa in.aln.map > out.indelpe

เรียกอินเดลที่สอดคล้องกันจากการอ่านปลายคู่ ผลลัพธ์ถูกคั่นด้วย TAB ด้วย
แต่ละเส้นประกอบด้วยโครโมโซม ตำแหน่งเริ่มต้น ประเภทของอินเดล หมายเลข
ของการอ่านข้ามอินเดล ขนาดของอินเดลและนิวคลีโอไทด์ที่แทรก/ลบ
(คั่นด้วยทวิภาค) จำนวนอินเดลบนเกลียวหลัง จำนวนอินเดล
บนเกลียวไปข้างหน้า 5 'ลำดับข้างหน้าของอินเดล 3' ลำดับต่อไป
อินเดล จำนวนการอ่านที่เรียงกันโดยไม่มีอินเดลและคอลัมน์เพิ่มเติมอีกสามคอลัมน์
สำหรับตัวกรอง

ที่คอลัมน์ที่ 3 ประเภทของอินเดล ดาวระบุว่าอินเดลได้รับการยืนยัน
โดยการอ่านจากทั้งสองเส้น a plus หมายถึง indel ถูกอ่านอย่างน้อยสองครั้ง
แต่จากเกลียวเดียวกัน เครื่องหมายลบแสดงว่าอินเดลมีการอ่านเพียงครั้งเดียว
และจุดหมายความว่าอินเดลอยู่ใกล้กับอินเดลอื่นมากเกินไปและถูกกรองออก

ขอแนะนำให้ผู้ใช้เรียกใช้ผ่าน `maq.pl indelpe' เพื่อแก้ไขจำนวน
อ่านที่แมปโดยไม่มีอินเดล สำหรับรายละเอียดเพิ่มเติม โปรดดูที่ `maq.pl indelpe'
มาตรา.

อินเดลโซ MAQ อินเดลโซ in.ref.bfa in.aln.map > out.indelsoa

เรียก indels homozygous ที่อาจเกิดขึ้นและจุดแตกหักโดยการตรวจจับสิ่งผิดปกติ
รูปแบบการจัดตำแหน่งรอบอินเดลและจุดแตกหัก ผลลัพธ์ยังเป็นTAB
คั่นด้วยแต่ละเส้นประกอบด้วยโครโมโซม พิกัดโดยประมาณ
ความยาวของพื้นที่ผิดปกติ จำนวนการอ่านที่แมปข้ามตำแหน่ง
จำนวนการอ่านทางด้านซ้ายของตำแหน่งและจำนวนการอ่านบน
ทางด้านขวามือ คอลัมน์สุดท้ายสามารถละเว้นได้

ผลลัพธ์ประกอบด้วยผลบวกปลอมจำนวนมาก ตัวกรองที่แนะนำอาจเป็น:

awk '$5+$6-$4 >= 3 && $4 <= 1' in.indelsoa

โปรดทราบว่าคำสั่งนี้ไม่ได้มุ่งหมายที่จะเป็นตัวตรวจจับอินเดลที่แม่นยำ แต่
ส่วนใหญ่ช่วยหลีกเลี่ยงผลบวกที่ผิดพลาดในการเรียกทดแทน ใน
นอกจากนี้ มันใช้งานได้ดีเมื่อมีความลึกเท่านั้น (เช่น ~ 40X); มิฉะนั้น
อัตราลบเท็จจะสูงมาก

รูปแบบ แปลง

sol2sanger MAQ sol2sanger in.sol.fastq out.sanger.fastq

แปลง Solexa FASTQ เป็นรูปแบบมาตรฐาน/Sanger FASTQ

bfq2fastq MAQ bfq2fastq ใน.read.bfq out.read.fastq

แปลงรูปแบบ BFQ ของ Maq เป็นรูปแบบ FASTQ มาตรฐาน

mapass2maq MAQ mapass2maq in.mapass2.map out.maq.map

แปลงรูปแบบแผนที่ของ mapass2 ที่ล้าสมัยเป็นรูปแบบแผนที่ของ Maq รูปแบบเก่าไม่
ไม่มีชื่อที่อ่าน

ข้อมูล สกัด

mapview MAQ mapview [-bN] in.aln.map > out.aln.txt

แสดงการจัดตำแหน่งการอ่านในข้อความธรรมดา สำหรับการอ่านที่สอดคล้องก่อน Smith-
การจัดตำแหน่ง Waterman แต่ละบรรทัดประกอบด้วย อ่านชื่อ โครโมโซม ตำแหน่ง
เกลียว, ขนาดเม็ดมีดจากโคออร์นีเอตด้านนอกของคู่, ธงคู่, การทำแผนที่
คุณภาพ, คุณภาพการทำแผนที่ด้านเดียว, คุณภาพการทำแผนที่ทางเลือก, จำนวน
ผลรวมของเบสที่ไม่ตรงกันของเบสที่ดีที่สุด
ตี จำนวนครั้ง 0 ไม่ตรงกันของ 24bp แรก จำนวน 1 ฮิตไม่ตรงกันของ
24bp แรกในการอ้างอิง ความยาวของการอ่าน ลำดับการอ่านและ
คุณภาพ. คุณภาพการทำแผนที่ทางเลือกจะเท่ากับคุณภาพการทำแผนที่เสมอหาก
การอ่านจะไม่จับคู่ หากการอ่านถูกจับคู่ จะเท่ากับการแมปที่เล็กกว่า
คุณภาพของปลายทั้งสอง คุณภาพการทำแผนที่ทางเลือกนี้เป็นจริง
คุณภาพการทำแผนที่ของคู่ที่ผิดปกติ

คอลัมน์ที่ห้า แฟล็กคู่ เป็นแฟล็กระดับบิต 4 บิตที่ต่ำกว่าของมันให้
การปฐมนิเทศ: 1 ย่อมาจาก FF, 2 สำหรับ FR, 4 สำหรับ RF และ 8 สำหรับ RR โดยที่ FR หมายถึง
ว่าการอ่านที่มีพิกัดน้อยกว่าอยู่บนเกลียวไปข้างหน้าและคู่ของมันคือ
บนเกลียวย้อนกลับ อนุญาตให้ใช้ FR เท่านั้นสำหรับคู่ที่ถูกต้อง บิตที่สูงขึ้น
ของธงนี้ให้ข้อมูลเพิ่มเติม หากคู่นั้นมาบรรจบกัน
ความต้องการ 16 จะถูกกำหนด หากการอ่านทั้งสองถูกแมปไปที่ต่างกัน
โครโมโซม 32 จะถูกตั้งค่า หากการอ่านค่าใดค่าหนึ่งจากสองค่านี้ไม่สามารถจับคู่ได้เลย
64 จะถูกตั้งค่า แฟล็กสำหรับคู่ที่ถูกต้องจะเท่ากับ 18 เสมอ

สำหรับการอ่านที่จัดเรียงโดยการจัดตำแหน่ง Smith-Waterman ในภายหลัง ธงคือ
เสมอ 130 บรรทัดประกอบด้วยชื่ออ่าน โครโมโซม ตำแหน่ง เกลียว แทรก
ขนาด, แฟล็ก (130 เสมอ), ตำแหน่งของอินเดลที่การอ่าน (0 หากไม่มีอินเดล),
ความยาวของอินเดล (บวกสำหรับการแทรกและค่าลบสำหรับการลบ)
คุณภาพการจับคู่ของคู่ของมัน จำนวนครั้งของการตีที่ดีที่สุดที่ไม่ตรงกัน ผลรวมของ
คุณภาพของฐานที่ไม่ตรงกันของการโจมตีที่ดีที่สุด สองศูนย์ ความยาวของการอ่าน
อ่านลำดับและคุณภาพของมัน คู่ของการอ่านค่าสถานะ 130 จะได้รับ a . เสมอ
ธง 18.

แฟล็ก 192 ระบุว่าการอ่านไม่ได้ถูกแมป แต่จับคู่คู่ของมันแล้ว สำหรับการดังกล่าว
คู่การอ่าน การอ่านหนึ่งครั้งมีแฟล็ก 64 และอีกคู่หนึ่งมี 192

ตัวเลือก:

-b ไม่แสดงลำดับการอ่านและคุณภาพ

-N แสดงตำแหน่งที่เกิดไม่ตรงกัน แฟล็กนี้ใช้ได้เท่านั้น
ด้วยไฟล์ .map ที่สร้างโดย `maq map -N'

mapcheck MAQ mapcheck [-s] [-m maxmis] [-q นาทีQ] in.ref.bfa in.aln.map > out.mapcheck

อ่านการตรวจสอบคุณภาพ mapcheck รายงานองค์ประกอบและความลึกของ .ก่อน
ข้อมูลอ้างอิง หลังจากนั้นก็มีแบบ คอลัมน์แรกระบุว่า
ตำแหน่งในการอ่าน ตามสี่คอลัมน์ที่แสดงนิวคลีโอไทด์
องค์ประกอบอัตราการทดแทนระหว่างการอ้างอิงและการอ่านจะได้รับ
อัตราเหล่านี้และตัวเลขในคอลัมน์ต่อไปนี้ถูกปรับขนาดเป็น 999 และ
ปัดเศษเป็นจำนวนเต็มที่ใกล้ที่สุด คอลัมน์กลุ่มถัดไปแสดงการแจกแจงของ
คุณสมบัติพื้นฐานพร้อมการอ่านที่ช่วงคุณภาพ 10 การสลายตัวของคุณภาพ
มักจะสังเกตได้ ซึ่งหมายความว่าฐานที่ส่วนท้ายของการอ่านมีค่าน้อยกว่า
แม่นยำ. คอลัมน์กลุ่มสุดท้ายแสดงเศษส่วนของการแทนที่สำหรับ
อ่านฐานในช่วงเวลาคุณภาพ เป็นการวัดความแม่นยำของคุณภาพฐาน
ประมาณการ เป็นการดีที่เราคาดว่าจะเห็น 1 ใน 3? คอลัมน์ 10 ใน 2? คอลัมน์
และ 100 ใน 1? คอลัมน์.

ตัวเลือก:

-s ใช้คุณภาพการทำแผนที่ด้านเดียวเป็นคุณภาพการทำแผนที่ขั้นสุดท้าย

-m INT จำนวน mismatahces สูงสุดที่อนุญาตให้นับการอ่าน [4]

-q INT คุณภาพการแมปขั้นต่ำที่อนุญาตให้นับการอ่าน [30]

กระเจิดกระเจิง MAQ กระเจิดกระเจิง [-spvP] [-m maxmis] [-Q maxerr] [-q นาทีQ] [-l ไฟล์ไซต์] in.ref.bfa
in.aln.map > out.pilup

แสดงการจัดตำแหน่งในรูปแบบข้อความ "ซ้อน" แต่ละบรรทัดประกอบด้วย
โครโมโซม ตำแหน่ง ฐานอ้างอิง ความลึก และฐานที่อ่านจากปก
ตำแหน่งนี้. ถ้า -v ถูกเพิ่มในบรรทัดคำสั่ง คุณสมบัติพื้นฐาน และการทำแผนที่
คุณสมบัติจะถูกนำเสนอในคอลัมน์ที่หกและเจ็ดตามลำดับ

คอลัมน์ที่ห้าเริ่มต้นด้วย `@' เสมอ ในคอลัมน์นี้ อ่านฐานว่าเหมือนกัน
การอ้างอิงจะแสดงด้วยเครื่องหมายจุลภาค `,' หรือจุด `.' และอ่านฐานที่แตกต่างกัน
จากการอ้างอิงในจดหมาย เครื่องหมายจุลภาคหรือตัวพิมพ์ใหญ่แสดงว่าฐาน
มาจากการอ่านที่อยู่ในแนวหน้าในขณะที่จุดหรือตัวพิมพ์เล็กบน
สาระย้อนกลับ

คำสั่งนี้มีไว้สำหรับผู้ใช้ที่ต้องการพัฒนาผู้โทร SNP ของตนเอง

ตัวเลือก:

-s ใช้คุณภาพการทำแผนที่ด้านเดียวเป็นคุณภาพการทำแผนที่ขั้นสุดท้าย

-p ละทิ้งการอ่านสิ้นสุดที่จับคู่ที่ไม่ได้แมปเป็นคู่ที่ถูกต้อง

-v ส่งออกข้อมูลอย่างละเอียดรวมถึงคุณภาพฐานและการทำแผนที่
คุณภาพ

-m INT จำนวนไม่ตรงกันสูงสุดที่อนุญาตให้ใช้การอ่าน [7]

-Q INT จำนวนค่าคุณภาพที่ไม่ตรงกันสูงสุดที่อนุญาต [60]

-q INT คุณภาพการแมปขั้นต่ำที่อนุญาตให้ใช้การอ่าน [0]

-l ไฟล์ ไฟล์ที่มีไซต์ที่จะพิมพ์ไพล์อัพ ในเรื่องนี้
file คอลัมน์แรกให้ชื่อของการอ้างอิงและวินาที
พิกัด. คอลัมน์เพิ่มเติมจะถูกละเว้น [โมฆะ]

-P ยังส่งออกตำแหน่งฐานในการอ่าน

cns2fq MAQ cns2fq [-Q minMapQ] [-n minNeiQ] [-d นาทีความลึก] [-D maxDepth] in.cns >
out.cns.fastq

แยกลำดับฉันทามติในรูปแบบ FASTQ ในบรรทัดลำดับ ฐาน
ตัวพิมพ์เล็กมักจะซ้ำกันหรือไม่มีการครอบคลุมเพียงพอ ฐาน
ตัวพิมพ์ใหญ่ระบุภูมิภาคที่สามารถเรียก SNP ได้อย่างน่าเชื่อถือ ใน
เส้นคุณภาพ ASCII ของอักขระลบ 33 ให้คุณภาพ PHRED

ตัวเลือก:

-Q INT คุณภาพการทำแผนที่ขั้นต่ำ [40]

-d INT ความลึกในการอ่านขั้นต่ำ [3]

-n INT คุณภาพเพื่อนบ้านขั้นต่ำ (20)

-D INT ระยะการอ่านสูงสุด >=255 ไม่จำกัดจำนวน [255]

cns2snp MAQ cns2snp in.cns > out.snp

แยกไซต์ SNP แต่ละเส้นประกอบด้วยโครโมโซม ตำแหน่ง ฐานอ้างอิง
ฐานฉันทามติ คุณภาพฉันทามติเหมือน Phred ความลึกในการอ่าน จํานวนเฉลี่ย
จำนวนการอ่านที่ครอบคลุมตำแหน่งนี้ คุณภาพการทำแผนที่สูงสุดของการอ่าน
ครอบคลุมตำแหน่งคุณภาพฉันทามติขั้นต่ำในการขนาบข้าง 3bp
ภูมิภาคที่แต่ละด้านของไซต์ (ทั้งหมด 6bp) การโทรที่ดีที่สุดอันดับสอง log
อัตราส่วนความน่าจะเป็นที่ดีที่สุดอันดับสองและการโทรที่ดีที่สุดอันดับสามและอันดับสามที่ดีที่สุด
โทร.

คอลัมน์ที่ 5 เป็นเกณฑ์สำคัญเมื่อคุณตัดสินความน่าเชื่อถือของ SNP
อย่างไรก็ตาม เนื่องจากคุณภาพนี้คำนวณโดยสมมติความเป็นอิสระของไซต์ คุณ
ควรพิจารณาคอลัมน์อื่นด้วยเพื่อให้ได้รับการเรียก SNP ที่แม่นยำยิ่งขึ้น สคริปต์
คำสั่ง `maq.pl SNPfilter' ออกแบบมาเพื่อสิ่งนี้ (ดูด้านล่าง)

คอลัมน์ที่ 7 บ่งบอกว่าไซต์อยู่ในพื้นที่ที่ซ้ำกันหรือไม่ ถ้าไม่
อ่านครอบคลุมเว็บไซต์สามารถแมปด้วยคุณภาพการทำแผนที่สูงขนาบข้าง
ภูมิภาคอาจซ้ำซากหรือขาดการอ่านที่ดี SNP ที่ไซต์ดังกล่าว
มักจะไม่น่าเชื่อถือ

คอลัมน์ที่ 8 ให้หมายเลขสำเนาของบริเวณขนาบใน
จีโนมอ้างอิง ในกรณีส่วนใหญ่ ตัวเลขนี้เข้าใกล้ 1.00 ซึ่งหมายถึง
ภูมิภาคมีความเป็นเอกลักษณ์ บางครั้งคุณอาจเห็นความลึกในการอ่านที่ไม่เป็นศูนย์ แต่ 0.00 ที่
คอลัมน์ที่ 7 นี่แสดงว่าการอ่านทั้งหมดที่ครอบคลุมตำแหน่งมีที่
ไม่ตรงกันอย่างน้อยสองครั้ง Maq จะนับเฉพาะจำนวนการตี 0 และ 1 ที่ไม่ตรงกันถึง
ข้อมูลอ้างอิง เนื่องจากปัญหาทางเทคนิคที่ซับซ้อน

คอลัมน์ที่ 9 ให้คุณภาพใกล้เคียง การกรองคอลัมน์นี้ก็เช่นกัน
จำเป็นต้องได้รับ SNP ที่เชื่อถือได้ แนวคิดนี้ได้รับแรงบันดาลใจจาก NQS แม้ว่า NQS จะเป็น
แรกเริ่มออกแบบมาสำหรับการอ่านเพียงครั้งเดียวแทนที่จะเป็นฉันทามติ

cns2view MAQ cns2view in.cns > out.view

แสดงข้อมูลโดยละเอียดที่ไซต์ทั้งหมด รูปแบบเอาต์พุตเหมือนกับ
cns2snp แจ้ง

cns2ref MAQ cns2ref in.cns > out.ref.fasta

แยกลำดับการอ้างอิง

cns2win MAQ cns2win [-w winsize] [-c chr] [-b เริ่ม] [-e ปลาย] [-q นาทีQ] in.cns >
out.win

ดึงข้อมูลโดยเฉลี่ยในหน้าต่างการไถพรวน เอาต์พุตเป็นตัวคั่น TAB
ซึ่งประกอบด้วยชื่ออ้างอิง พิกัดหารด้วย 1,000,000 อัตรา SNP
อัตรา het, ความลึกในการอ่านดิบ, ความลึกในการอ่านในภูมิภาคที่ไม่ซ้ำกันโดยประมาณ, the
จำนวนการอ่านเฉลี่ยในหน้าต่างและเปอร์เซ็นต์ GC

ตัวเลือก:

-w INT ขนาดของหน้าต่าง [1000]

-c STR ลำดับการอ้างอิงปลายทาง มิฉะนั้นจะถูกนำมาใช้อ้างอิงทั้งหมด
[โมฆะ]

-b INT ตำแหน่งเริ่มต้น 0 โดยไม่มีข้อจำกัด [0]

-e INT ตำแหน่งสิ้นสุด 0 โดยไม่มีข้อจำกัด [0]

-q INT คุณภาพฉันทามติขั้นต่ำของไซต์ที่จะใช้ [0]

จำลอง ที่เกี่ยวข้อง

ของปลอม MAQ ของปลอม [-r กลายพันธุ์] [-R อินเดลแฟรค] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

สุ่มแนะนำการแทนที่และอินเดลไปยังข้อมูลอ้างอิง การเปลี่ยนตัวและ
สามารถเพิ่มอินเดลคู่เบสได้

ตัวเลือก:

-r ลอย อัตราการกลายพันธุ์ [0.001]

-R ลอย เศษส่วนของการกลายพันธุ์ที่จะเป็นอินเดล [0.1]

ซิมูเทรน MAQ ซิมูเทรน out.simupars.dat in.read.fastq

ค่าประมาณ/พารามิเตอร์ฝึกสำหรับการจำลองการอ่าน

แกล้งทำ MAQ แกล้งทำ [-d ในขนาด] [-s stdev] [-N nReads] [-1 อ่านLen1] [-2 อ่านLen2] [-r
mutRate] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq in.ref.fasta
in.simupars.dat

จำลองการอ่านปลายคู่ ไฟล์ in.simupars.dat กำหนดความยาวในการอ่านและ
การกระจายคุณภาพ มันถูกสร้างขึ้นจาก ซิมูเทรน, หรือสามารถดาวน์โหลดได้จาก
เว็บไซต์แม็ก. ในไฟล์เอาต์พุตการอ่าน ชื่อที่อ่านประกอบด้วยการอ้างอิง
ชื่อลำดับและพิกัดภายนอกของคู่การอ่านจำลอง โดย
ค่าเริ่มต้น, แกล้งทำ ถือว่าการอ่านมาจากลำดับซ้ำซึ่งถูกสร้างขึ้น
โดยการเพิ่มการกลายพันธุ์ที่แตกต่างกันสองชุด รวมทั้งอินเดลคู่เบสหนึ่งชุด to
in.ref.fasta.

ตัวเลือก:

-d INT ค่าเฉลี่ยระยะนอกของขนาดเม็ดมีด [170]

-s INT ส่วนเบี่ยงเบนมาตรฐานของขนาดเม็ดมีด [20]

-N INT จำนวนคู่ของการอ่านที่จะสร้าง [1000000]

-1 INT ความยาวของการอ่านครั้งแรก [กำหนดโดย in.simupars.dat]

-2 INT ความยาวของการอ่านครั้งที่สอง [กำหนดโดย in.simupars.dat]

-r ลอย อัตราการกลายพันธุ์ [0.001]

-R ลอย เศษส่วนของอินเดล 1bp [0.1]

-h เพิ่มการกลายพันธุ์ทั้งหมดไปที่ in.ref.fasta และสร้างการอ่านจากซิงเกิ้ล
ลำดับการกลายพันธุ์ (โหมดเดี่ยว)

หมายเหตุ:

* การอ่านที่สร้างจากคำสั่งนี้เป็นอิสระ ซึ่งแตกต่างจาก
ความจริง. ในขณะที่การประเมินการจัดตำแหน่งได้รับผลกระทบน้อยกว่านี้ การประเมินบน
การโทร SNP ควรดำเนินการด้วยความระมัดระวัง การพึ่งพาข้อผิดพลาดอาจเป็นหนึ่งใน
สาเหตุหลักของการเรียก SNP ที่ไม่ถูกต้อง

simusat MAQ simusat in.simu-aln.map > out.simusat

ประเมินคุณภาพการทำแผนที่จากการอ่านจำลอง

แข็ง ที่เกี่ยวข้อง

fasta2csfa MAQ fasta2csfa in.nucl-ref.fasta > out.color-ref.fasta

แปลงนิวคลีโอไทด์ FASTA เป็น FASTA ที่มีรหัสสี ธง -c ก็ควรจะทา
ไปยัง แผนที่ สั่งการ. ในผลลัพธ์ ตัวอักษร 'A' หมายถึงสี 0, 'C' แทน 1, 'G'
สำหรับ 2 และ 'T' สำหรับ 3 แต่ละลำดับในเอาต์พุตจะสั้นกว่าอินพุต 1bp

csmap2nt MAQ csmap2nt out.nt.map in.ref.nt.bfa in.cs.map

เปลี่ยนการจัดตำแหน่งสีเป็นการจัดตำแหน่งนิวคลีโอไทด์ อินพุต in.ref.nt.bfa คือ
ไฟล์อ้างอิงไบนารีนิวคลีโอไทด์ FASTA ต้องสอดคล้องกับไฟล์ต้นฉบับ
ซึ่งการอ้างอิงสีจะถูกแปลง ฉันทามติของนิวคลีโอไทด์สามารถเรียกได้ว่า
จากการจัดตำแหน่งผลลัพธ์

เบ็ดเตล็ด/ขั้นสูง คำสั่ง

แผนที่ย่อย MAQ แผนที่ย่อย [-q minMapQ] [-Q maxSumErr] [-m maxMM] [-p] out.map in.map

กรองการจัดตำแหน่งที่ไม่ถูกต้องใน in.map. ตัวเลือกบรรทัดคำสั่งมีอธิบายไว้ใน
`รวบรวม' สั่งการ.

eland2maq MAQ eland2maq [-q defqual] out.map in.list in.eland

แปลงการจัดตำแหน่ง eland เป็นรูปแบบ .map ของ maq ไฟล์ in.list ประกอบด้วย
ชื่อลำดับที่ปรากฏที่คอลัมน์ที่เจ็ดของไฟล์การจัดตำแหน่งอีแลนด์
in.eland และชื่อที่คุณคาดว่าจะเห็นในการจัดตำแหน่ง maq ต่อไปนี้เป็น
ตัวอย่าง:

cX.fa chrX
c1.fa chr1
c2.fa chr2

หากคุณกำลังจัดแนวการอ่านหลายชุดโดยใช้ eland สิ่งสำคัญคือต้อง
ใช้เหมือนกัน in.list สำหรับการแปลง นอกจากนี้ maq จะโหลดทั้งหมด
จัดตำแหน่งและจัดเรียงไว้ในหน่วยความจำ หากคุณมีการเชื่อมต่อหลาย eland
ออกเป็นไฟล์ขนาดใหญ่ไฟล์เดียว คุณควรแยกไฟล์ออกเป็นไฟล์ขนาดเล็กเป็น
ป้องกันไม่ให้ maq กินหน่วยความจำเครื่องทั้งหมดของคุณ

คำสั่งนี้มีจุดมุ่งหมายเพื่อแสดงการจัดตำแหน่ง Eland ใน Maqview ไม่มีคุณภาพ
มีข้อมูลให้ ไม่ควรใช้ไฟล์การจัดตำแหน่ง maq ที่เป็นผลลัพธ์
เพื่อเรียกจีโนไทป์ฉันทามติ

ส่งออก2maq MAQ ส่งออก2maq [-1 read1len] [-2 read2len] [-a maxdist] [-n] out.map in.list
in.export

แปลงรูปแบบการส่งออกของ Illumina เป็น Maq's .แผนที่ รูปแบบ. รูปแบบการส่งออกเป็นรูปแบบใหม่
รูปแบบการจัดตำแหน่งตั้งแต่ SolexaPipeline-0.3.0 ซึ่งคำนวณการแมปด้วย
คุณสมบัติเช่น maq ไฟล์ผลลัพธ์สามารถใช้เรียกฉันทามติ genotypes
เนื่องจากข้อมูลที่จำเป็นส่วนใหญ่มีให้ maq ดำเนินการได้อย่างถูกต้อง

ตัวเลือก:

-1 INT ความยาวของการอ่านครั้งแรก [0]

-2 INT ความยาวของการอ่านครั้งที่สอง [0]

-a INT ระยะห่างภายนอกสูงสุดสำหรับคู่การอ่านที่ถูกต้อง [250]

-n เก็บกรองอ่าน

MAQ-PERL คำสั่ง


สาธิต maq.pl สาธิต [-h] [-s] [-N nPairs] [-d ออกDir] in.fasta in.simudat

สาธิตการใช้ MAQ และสคริปต์ประกอบ คำสั่งนี้จะ
จำลองการอ่านจากไฟล์ FASTA in.fasta. ความยาวและคุณภาพของลำดับ
ถูกกำหนดโดย in.simudat ซึ่งเกิดจาก MAQ ซิมูเทรน หรือสามารถ
ดาวน์โหลดจากเว็บไซต์ Maq การอ่านจำลองจะถูกจับคู่กับ
maq.pl easyrun. ความแม่นยำในการจัดตำแหน่งถูกประเมินโดย MAQ simusatที่
ความถูกต้องฉันทามติโดย MAQ simucnsและความแม่นยำ SNP โดย maq_eval.pl.

โดยค่าเริ่มต้น การอ่านสิ้นสุดที่จับคู่จะถูกจำลองและลำดับซ้ำจะเป็น
สร้างจากอินพุตโดยเพิ่มการกลายพันธุ์เป็นประเภทเดี่ยว ตัวแทรก
ขนาดและอัตราการกลายพันธุ์ถูกควบคุมโดย MAQ แกล้งทำ.

ตัวเลือก:

-h จำลองลำดับเดี่ยวแทนลำดับซ้ำ

-s ใช้โหมดปลายเดียวเพื่อจัดแนวการอ่านแทนโหมดปลายคู่

-N INT จำนวนคู่ของการอ่านที่จะจำลอง [1000000]

-d DIR ไดเร็กทอรีเอาต์พุต [maqdemo]

หมายเหตุ:

* ไฟล์ที่ส่งออกจาก maq_eval.pl ไม่ได้จัดทำเป็นเอกสาร แต่ท่านอาจทำ
เดาได้ดีที่บางไฟล์เหล่านี้

* คำสั่งนี้เพียงสาธิตการใช้ชุด maq ความแม่นยำของจริง
ข้อมูลมักจะต่ำกว่าที่คุณเห็นจากการจำลองแบบล้วนๆ

easyrun maq.pl easyrun [-1 read1Len] [-d out.dir] [-n nReads] [-A 3อะแดปเตอร์] [-e นาทีDep]
[-q minCnsQ] [-p] [-2 read2Len] [-a maxIns] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]

วิเคราะห์ไปป์ไลน์สำหรับจีโนมขนาดเล็ก คำสั่ง Easyrun จะรันการวิเคราะห์ส่วนใหญ่
นำมาใช้ MAQ. โดยค่าเริ่มต้น, easyrun ถือว่าอินพุตทั้งหมดอ่านลำดับ
ไฟล์เป็นแบบปลายเดียวและเป็นอิสระ เมื่อไร -p ถูกระบุ สองลำดับการอ่าน
ต้องมีไฟล์หนึ่งไฟล์สำหรับแต่ละปลาย

ไฟล์หลายไฟล์จะถูกสร้างขึ้นใน out.dirซึ่งไฟล์ต่อไปนี้คือ
เอาท์พุทที่สำคัญ:

cns.final.snp การโทร SNP ขั้นสุดท้ายด้วยการโทรที่มีคุณภาพต่ำถูกกรองออก

cns.fq ลำดับและคุณภาพที่เป็นเอกฉันท์ในรูปแบบ FASTQ

ตัวเลือก:

-d DIR ไดเร็กทอรีเอาต์พุต [easyrun]

-n INT จำนวนการอ่าน/คู่ในหนึ่งชุดของการจัดตำแหน่ง [2000000]

-S ใช้การวิเคราะห์แบบแยกอ่านของอินเดลสั้น (อาจช้ามาก)

-N INT จำนวน haplotypes/สายพันธุ์ในสระ (>=2) [2]

-A ไฟล์ ไฟล์สำหรับ 3'-adapter ไฟล์ควรมีลำดับบรรทัดเดียว
[โมฆะ]

-1 INT ความยาวของการอ่านครั้งแรก 0 สำหรับอัตโนมัติ [0]

-e INT ความลึกในการอ่านขั้นต่ำที่จำเป็นในการเรียก SNP (สำหรับ SNPfilter) [3]

-q INT คุณภาพฉันทามติขั้นต่ำสำหรับ SNP ใน cns.final.snp [30]

-p เปลี่ยนเป็นโหมดการจัดตำแหน่งปลายที่จับคู่

-2 INT ความยาวของวินาทีอ่านเมื่อ -p ถูกนำไปใช้ [0]

-a INT ขนาดเม็ดมีดสูงสุดเมื่อ -p ถูกนำไปใช้ [250]

หมายเหตุ:

* สำหรับการเรียก SNP ในตัวอย่างแบบรวม ผู้ใช้ควรตั้งค่า ` . ที่ถูกต้อง-N' เช่นกัน
`-E 0'

* ไฟล์อินพุตสามารถเป็นรูปแบบไบนารีของ maq ได้ maq.pl จะตรวจจับโดยอัตโนมัติ
รูปแบบไฟล์

SNPfilter maq.pl SNPfilter [-d นาทีDep] [-D maxDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F in.indelpe] [-f in.indelsoa] [-s คะแนนขั้นต่ำ] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinSize] in.cns2snp.snp >
out.filtered.snp

แยกแยะ SNPs ที่ครอบคลุมโดยการอ่านไม่กี่ครั้ง (ระบุโดย -d) โดยมากเกินไป
อ่าน (ระบุโดย -D) ใกล้ (ระบุโดย -w) สู่อินเดลที่อาจเกิดขึ้น
ในพื้นที่ที่เกิดซ้ำได้ (แสดงโดย -Q) หรือมีคุณภาพต่ำ
ฐานใกล้เคียง (ระบุโดย -n) ถ้า maxWinSNP หรือมากกว่า SNP ปรากฏในใดๆ
densWinSize หน้าต่างก็จะถูกกรองออกไปพร้อมกันด้วย

ตัวเลือก:

-d INT ความลึกในการอ่านขั้นต่ำที่จำเป็นในการเรียก SNP [3]

-D INT ความลึกในการอ่านสูงสุดที่จำเป็นในการเรียก SNP (<255 มิฉะนั้นจะละเว้น)
[256]

-Q INT ต้องการคุณภาพการทำแผนที่สูงสุดของการอ่านที่ครอบคลุม SNP [40]

-q INT คุณภาพฉันทามติขั้นต่ำ (20)

-n INT คุณภาพฉันทามติที่อยู่ติดกันขั้นต่ำ (20)

-w INT ขนาดของหน้าต่างรอบๆ อินเดลที่มีศักยภาพ SNP ที่ใกล้เคียง
ให้อินเดลถูกระงับ [3]

-F ไฟล์ พื้นที่ปลูก indelpe เอาท์พุท [null]

-f ไฟล์ พื้นที่ปลูก อินเดลโซ เอาท์พุท [null]

-s INT คะแนนขั้นต่ำสำหรับ soa-indel ที่จะพิจารณา [3]

-m INT จำนวนการอ่านสูงสุดที่สามารถแมปข้าม soa-indel [1]

-a ตัวกรองทางเลือกสำหรับการจัดตำแหน่งปลายด้านเดียว

indelpe maq.pl indelpe in.indelpe > out.indelpe

แก้ไขจำนวนการอ่านที่แมปโดยไม่มี indels สำหรับ homopolymer tracts นี้
คำสั่งแก้ไขคอลัมน์ที่ 4, 10 และสามคอลัมน์สุดท้ายของ in.indelpe และ
ส่งออกผลลัพธ์ใน out.indelpe. หลังจากแก้ไขดังนี้ awk
คำสั่งให้ indels homozygous สมมุติ:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

และต่อไปนี้ให้ heterozygotes:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

โปรดทราบว่านี้ indelpe คำสั่งเพียงใช้กฎฮิวริสติกหลายข้อ
ไม่ถูกต้องสำหรับโฮโมพอลิเมอร์ที่ไม่บริสุทธิ์หรือได-นิวคลีโอไทด์/ทริปเล็ต
ซ้ำ ดังนั้น ทั้งสองคำสั่ง awk ให้เพียง hom/het . โดยประมาณเท่านั้น
อินเดล

ตัวอย่าง


·สคริปต์ Easyrun:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· คีย์คำสั่งเบื้องหลัง easyrun:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq part1.fastq part1.bfq;
maq fastq2bfq part2.fastq part2.bfq;
แผนที่ maq part1.map ref.bfa part1.bfq;
แผนที่ maq part2.map ref.bfa part2.bfq;
maq mapmerge aln.map part1.map part2.map;
maq ประกอบ cns.cns ref.bfa aln.map;

ใช้ maq ออนไลน์โดยใช้บริการ onworks.net


Ad


Ad

โปรแกรมออนไลน์ Linux และ Windows ล่าสุด