นี่คือคำสั่ง meryl ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
meryl - การนับ kmer เข้าและออกจากคอร์และยูทิลิตี้
เรื่องย่อ
ประมาณ หน่วยความจำ ความต้องการ
เมอรีล -P -m กมเมอร์ไซส์ [-c #] [-p] -s seq.fasta
เมอรีล -P -m กมเมอร์ไซส์ [-c #] [-p] -n พ่อค้า
การก่อสร้าง a ตาราง
เมอรีล -B -m กมเมอร์ไซส์ [-c #] [-p] [-v] [-f|-r|-C] [-L เหตุการณ์เล็กน้อย] [-U สูงสุด]
[-กระทู้ n - --กลุ่ม กลุ่ม | - หน่วยความจำ เมกะไบต์--configbatch [-sge ชื่องาน-
-s seq.fasta -o tblคำนำหน้า
เมอรีล -นับแบทช์ จำนวน [-sgebuild "qsuboptionstring"] -o tblคำนำหน้า
เมอรีล -ผสานแบทช์ จำนวน [-sgemerge "qsuboptionstring"] -o tblคำนำหน้า
เล่นละคร การดำเนินงาน on a ตาราง
เมอรีล -M การดำเนินการ [-v] -s tblคำนำหน้า [-s tblคำนำหน้า2 ... ] -o เอาท์พุต
ทิ้ง a ตาราง
เมอรีล -ด.ช -s tblคำนำหน้า
เมอรีล -ด.ต -n ขั้นต่ำ -s tblคำนำหน้า
DESCRIPTION
เมอรีล คำนวณเนื้อหา kmer ของลำดับจีโนม เนื้อหา Kmer แสดงเป็น
รายชื่อ kmers และจำนวนครั้งที่เกิดขึ้นในลำดับอินพุต kmer สามารถ
จำกัดเฉพาะตัวกม.ไปข้างหน้า เฉพาะกมเมอร์ถอยหลัง หรือกมเมอร์ตามบัญญัติเท่านั้น
(คำศัพท์ที่เล็กกว่าของกมเมอร์ไปข้างหน้าและถอยหลังในแต่ละตำแหน่ง) เมอรีล สามารถ
รายงานฮิสโตแกรมของการนับ รายการของ kmers และการนับของพวกเขาหรือสามารถดำเนินการ
การดำเนินการทางคณิตศาสตร์และการตั้งค่าในไฟล์ข้อมูลที่ประมวลผล
ผลลัพธ์ของ เมอรีล เป็นไฟล์ไบนารี XNUMX ไฟล์ เรียกว่า ฐานข้อมูลเมอริล ซึ่งสามารถทำได้อย่างรวดเร็ว
ทิ้งเพื่อแสดงฮิสโตแกรมของการนับ หรือการนับจริง มีห้องสมุด C ++ ให้
เพื่อเข้าถึงไฟล์โดยตรง
OPTIONS
-P ประมาณการความต้องการหน่วยความจำ รับไฟล์ลำดับ (-s) หรือขีด จำกัด บนของ
จำนวนเมอร์ในไฟล์ (-n) คำนวณขนาดตาราง (-t ในการสร้าง) เพื่อลดขนาด
การใช้หน่วยความจำ โหมดนี้รู้จักตัวเลือกต่อไปนี้:
-m # ขนาดของแมร์ (จำเป็น)
-c # การบีบอัดโฮโมพอลิเมอร์ (ไม่จำเป็น)
-p เปิดใช้งานตำแหน่ง
-s seq.fasta
ไฟล์ลำดับที่จะสแกนเพื่อกำหนดจำนวน mers
-n # คำนวณพารามิเตอร์โดยสมมติว่าไฟล์มีเมอร์จำนวนมากอยู่ในนั้น
หนึ่งเดียวใน -s, -n จำเป็นต้องระบุ ถ้าให้ทั้งสองอย่าง -s มีความสำคัญ
-B คำนวณตาราง mer-count ที่กำหนดไฟล์ลำดับ (-s) และพารามิเตอร์มากมาย โดย
ค่าเริ่มต้น ทั้งสองเส้นจะถูกประมวลผล
-f สร้างมาเพื่อกองหน้าเท่านั้น
-r สร้างสำหรับเกลียวย้อนกลับเท่านั้น
-C ใช้ canonical mers (ถือว่าทั้งสองเส้น)
-L # อย่าช่วยชีวิตเมอร์ที่เกิดขึ้นน้อยกว่า # ครั้ง
-U # Don't save mers ที่เกิดขึ้นมากกว่า # ครั้ง
-m # ขนาดของแมร์ (จำเป็น)
-c # การบีบอัดโฮโมพอลิเมอร์ (ไม่จำเป็น)
-p เปิดใช้งานตำแหน่ง
-s seq.fasta
ลำดับการสร้างตารางสำหรับ
-o tblคำนำหน้า
คำนำหน้าตารางผลลัพธ์
-v ให้ความบันเทิงแก่ผู้ใช้
พื้นที่ เมอรีล กระบวนการสามารถทำงานในแบตช์หน่วยความจำขนาดใหญ่ชุดเดียว ในชุดหน่วยความจำขนาดเล็กจำนวนมาก
หรืออยู่ภายใต้การควบคุมของ SGE ทั้งหมดมีหรือไม่มีคอร์ CPU หลายตัว โดยค่าเริ่มต้น,
การคำนวณจะทำเป็นกระบวนการต่อเนื่องขนาดใหญ่ขั้นตอนเดียว การทำงานแบบมัลติเธรด
เป็นไปได้โดยใช้หน่วยความจำเพิ่มเติมเช่นเดียวกับการดำเนินการที่แบ่งส่วนเพิ่มเติม
ค่าใช้จ่าย I/O
threaded การดำเนินการ
แบ่งการนับออกเป็น n ชิ้นที่มีขนาดเกือบเท่ากัน สิ่งนี้ใช้ส่วนเสริม
h MB (จาก -P) ต่อเธรด
-กระทู้ n
ใช้ n กระทู้ที่จะสร้าง
แบ่งส่วน ตามลำดับ การดำเนินการ
แบ่งการนับออกเป็นชิ้น ๆ ที่จะมีขนาดไม่เกิน m MB ของ
หน่วยความจำหรือเป็น n ชิ้นที่มีขนาดเท่ากัน แต่ละชิ้นถูกคำนวณตามลำดับ
และผลลัพธ์จะถูกรวมเข้าด้วยกันในตอนท้าย หนึ่งเดียวใน - หน่วยความจำ และ -กลุ่ม is
จำเป็น
- หน่วยความจำ m
ใช้มากที่สุด m หน่วยความจำ MB ต่อเซ็กเมนต์
-กลุ่ม n
ใช้ n กลุ่ม
แบ่งส่วน เป็นกลุ่ม การดำเนินการ
เหมือนกับลำดับ ยกเว้นสิ่งนี้ทำให้แต่ละส่วนสามารถดำเนินการได้ด้วยตนเอง
ในแบบคู่ขนาน. หนึ่งเดียวใน - หน่วยความจำ และ -กลุ่ม มันจำเป็น. ดู .ด้วย
ตัวอย่าง ส่วนในหน้านี้
- หน่วยความจำ m
ใช้มากที่สุด m หน่วยความจำ MB ต่อเซ็กเมนต์
-กลุ่ม n
ใช้ n กลุ่ม
-configbatch
สร้างแบทช์
-นับแบทช์ n
เรียกใช้หมายเลขชุด n
-ผสานแบทช์
รวมแบตช์
โหมดแบตช์สามารถทำงานบนกริดได้
-sge ชื่องาน
ชื่องานเฉพาะสำหรับการดำเนินการนี้ เมอรีล จะส่งงานพร้อมชื่อ
mpชื่องาน, เอ็นซีชื่องาน, นาโนเมตรชื่องานสำหรับขั้นตอนการเตรียม นับและรวม
-sgebuild "ตัวเลือก"
-sgemerge "ตัวเลือก"
ตัวเลือกเพิ่มเติมเพื่อ คิวซับ(1) (เช่น "-p -153 -วิชาพลศึกษา ด้าย2 -A
merylaccount") NB - -N จะถูกละเว้น NB - อย่าลืมอ้างอิง
ตัวเลือก
-M ระบุรายการของตาราง ดำเนินการทางคณิตศาสตร์ ตรรกะ หรือขีดจำกัด เว้นแต่
ระบุไว้ การดำเนินการทั้งหมดใช้ฐานข้อมูลจำนวนเท่าใดก็ได้ การดำเนินการทางคณิตศาสตร์คือ:
นาที count คือจำนวนขั้นต่ำสำหรับฐานข้อมูลทั้งหมด ถ้าแมร์ไม่มีอยู่ใน
ฐานข้อมูลทั้งหมด mer มีการนับศูนย์และไม่ได้อยู่ในเอาต์พุต
mineexist
count คือจำนวนขั้นต่ำสำหรับฐานข้อมูลทั้งหมดที่มี mer
แม็กซ์ count คือจำนวนสูงสุดของฐานข้อมูลทั้งหมด
เพิ่ม count คือผลรวมของการนับสำหรับฐานข้อมูลทั้งหมด
ด้านล่าง นับเป็นครั้งแรกลบวินาที (ไบนารีเท่านั้น)
เอบีเอส count คือค่าสัมบูรณ์ของค่าแรกลบค่าที่สอง (ไบนารีเท่านั้น)
การดำเนินการทางตรรกะคือ:
และ ผลลัพธ์ mer if มันมีอยู่ในฐานข้อมูลทั้งหมด
NAND ผลลัพธ์ mer หากมีอยู่ในฐานข้อมูลอย่างน้อยหนึ่งฐานข้อมูล แต่ไม่ใช่ทั้งหมด
or ผลลัพธ์ mer หากมีอยู่ในฐานข้อมูลอย่างน้อยหนึ่งฐานข้อมูล
ซอร์ ผลลัพธ์ mer ถ้ามันมีอยู่ในฐานข้อมูลจำนวนคี่
การดำเนินการตามเกณฑ์คือ:
น้อยกว่า x
เอาท์พุต mer ถ้ามันมีการนับ < x
น้อยกว่าเท่ากัน x
ผลลัพธ์ mer ถ้ามันมีการนับ <= x
มากกว่า x
เอาท์พุต mer ถ้ามันมีการนับ > x
มากกว่าเท่ากัน x
เอาท์พุต mer ถ้ามันมีการนับ >= x
เท่ากัน x
ผลลัพธ์ mer ถ้ามีการนับ == x
การดำเนินการตามเกณฑ์ทำงานบนฐานข้อมูลเดียว
-s tblคำนำหน้า
ใช้ tblคำนำหน้า เป็นฐานข้อมูล
-o tblคำนำหน้า
สร้างผลลัพธ์นี้
-v ให้ความบันเทิงแก่ผู้ใช้
-D ตารางการถ่ายโอนข้อมูล (ไม่ใช่ทั้งหมด)
-พ ทิ้งฮิสโตแกรมของระยะห่างระหว่างเมอร์ตัวเดียวกัน
-ด.ต ทิ้ง mers >= ธรณีประตู ใช้ -n เพื่อระบุเกณฑ์
-กระแสตรง นับจำนวน mers mers ที่แตกต่างกันและ mers ที่ไม่ซ้ำกัน
-ด.ช ดัมพ์ (เป็น stdout) ฮิสโตแกรมของ mer นับ
-s อ่านตารางการนับจากที่นี่ (ทิ้ง .mcdat หรือ .mcidx)
ตัวอย่าง
ชุด การสร้าง of a ตาราง
เริ่มต้นการคำนวณด้วย -configbatchซึ่งต้องการตัวเลือกการสร้างทั้งหมด ดำเนินการทั้งหมด
-นับแบทช์ งานแล้ว -ผสานแบทช์ ให้เสร็จสมบูรณ์
เมอรีล -configbatch -B [ตัวเลือก] -o ไฟล์
เมอรีล -นับแบทช์ 0 -o ไฟล์
เมอรีล -นับแบทช์ 1 -o ไฟล์
...
เมอรีล -นับแบทช์ N -o ไฟล์
เมอรีล -ผสานแบทช์ N -o ไฟล์
ใช้เมอริลออนไลน์โดยใช้บริการ onworks.net