meryl - ออนไลน์ในคลาวด์

นี่คือคำสั่ง meryl ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

โครงการ:

ชื่อ


meryl - การนับ kmer เข้าและออกจากคอร์และยูทิลิตี้

เรื่องย่อ


ประมาณ หน่วยความจำ ความต้องการ
เมอรีล -P -m กมเมอร์ไซส์ [-c #] [-p] -s seq.fasta

เมอรีล -P -m กมเมอร์ไซส์ [-c #] [-p] -n พ่อค้า

การก่อสร้าง a ตาราง
เมอรีล -B -m กมเมอร์ไซส์ [-c #] [-p] [-v] [-f|-r|-C] [-L เหตุการณ์เล็กน้อย] [-U สูงสุด]
[-กระทู้ n - --กลุ่ม กลุ่ม | - หน่วยความจำ เมกะไบต์--configbatch [-sge ชื่องาน-
-s seq.fasta -o tblคำนำหน้า

เมอรีล -นับแบทช์ จำนวน [-sgebuild "qsuboptionstring"] -o tblคำนำหน้า

เมอรีล -ผสานแบทช์ จำนวน [-sgemerge "qsuboptionstring"] -o tblคำนำหน้า

เล่นละคร การดำเนินงาน on a ตาราง
เมอรีล -M การดำเนินการ [-v] -s tblคำนำหน้า [-s tblคำนำหน้า2 ... ] -o เอาท์พุต

ทิ้ง a ตาราง
เมอรีล -ด.ช -s tblคำนำหน้า

เมอรีล -ด.ต -n ขั้นต่ำ -s tblคำนำหน้า

DESCRIPTION


เมอรีล คำนวณเนื้อหา kmer ของลำดับจีโนม เนื้อหา Kmer แสดงเป็น
รายชื่อ kmers และจำนวนครั้งที่เกิดขึ้นในลำดับอินพุต kmer สามารถ
จำกัดเฉพาะตัวกม.ไปข้างหน้า เฉพาะกมเมอร์ถอยหลัง หรือกมเมอร์ตามบัญญัติเท่านั้น
(คำศัพท์ที่เล็กกว่าของกมเมอร์ไปข้างหน้าและถอยหลังในแต่ละตำแหน่ง) เมอรีล สามารถ
รายงานฮิสโตแกรมของการนับ รายการของ kmers และการนับของพวกเขาหรือสามารถดำเนินการ
การดำเนินการทางคณิตศาสตร์และการตั้งค่าในไฟล์ข้อมูลที่ประมวลผล

ผลลัพธ์ของ เมอรีล เป็นไฟล์ไบนารี XNUMX ไฟล์ เรียกว่า ฐานข้อมูลเมอริล ซึ่งสามารถทำได้อย่างรวดเร็ว
ทิ้งเพื่อแสดงฮิสโตแกรมของการนับ หรือการนับจริง มีห้องสมุด C ++ ให้
เพื่อเข้าถึงไฟล์โดยตรง

OPTIONS


-P ประมาณการความต้องการหน่วยความจำ รับไฟล์ลำดับ (-s) หรือขีด จำกัด บนของ
จำนวนเมอร์ในไฟล์ (-n) คำนวณขนาดตาราง (-t ในการสร้าง) เพื่อลดขนาด
การใช้หน่วยความจำ โหมดนี้รู้จักตัวเลือกต่อไปนี้:

-m # ขนาดของแมร์ (จำเป็น)

-c # การบีบอัดโฮโมพอลิเมอร์ (ไม่จำเป็น)

-p เปิดใช้งานตำแหน่ง

-s seq.fasta
ไฟล์ลำดับที่จะสแกนเพื่อกำหนดจำนวน mers

-n # คำนวณพารามิเตอร์โดยสมมติว่าไฟล์มีเมอร์จำนวนมากอยู่ในนั้น

หนึ่งเดียวใน -s, -n จำเป็นต้องระบุ ถ้าให้ทั้งสองอย่าง -s มีความสำคัญ

-B คำนวณตาราง mer-count ที่กำหนดไฟล์ลำดับ (-s) และพารามิเตอร์มากมาย โดย
ค่าเริ่มต้น ทั้งสองเส้นจะถูกประมวลผล

-f สร้างมาเพื่อกองหน้าเท่านั้น

-r สร้างสำหรับเกลียวย้อนกลับเท่านั้น

-C ใช้ canonical mers (ถือว่าทั้งสองเส้น)

-L # อย่าช่วยชีวิตเมอร์ที่เกิดขึ้นน้อยกว่า # ครั้ง

-U # Don't save mers ที่เกิดขึ้นมากกว่า # ครั้ง

-m # ขนาดของแมร์ (จำเป็น)

-c # การบีบอัดโฮโมพอลิเมอร์ (ไม่จำเป็น)

-p เปิดใช้งานตำแหน่ง

-s seq.fasta
ลำดับการสร้างตารางสำหรับ

-o tblคำนำหน้า
คำนำหน้าตารางผลลัพธ์

-v ให้ความบันเทิงแก่ผู้ใช้

พื้นที่ เมอรีล กระบวนการสามารถทำงานในแบตช์หน่วยความจำขนาดใหญ่ชุดเดียว ในชุดหน่วยความจำขนาดเล็กจำนวนมาก
หรืออยู่ภายใต้การควบคุมของ SGE ทั้งหมดมีหรือไม่มีคอร์ CPU หลายตัว โดยค่าเริ่มต้น,
การคำนวณจะทำเป็นกระบวนการต่อเนื่องขนาดใหญ่ขั้นตอนเดียว การทำงานแบบมัลติเธรด
เป็นไปได้โดยใช้หน่วยความจำเพิ่มเติมเช่นเดียวกับการดำเนินการที่แบ่งส่วนเพิ่มเติม
ค่าใช้จ่าย I/O

threaded การดำเนินการ
แบ่งการนับออกเป็น n ชิ้นที่มีขนาดเกือบเท่ากัน สิ่งนี้ใช้ส่วนเสริม
h MB (จาก -P) ต่อเธรด

-กระทู้ n
ใช้ n กระทู้ที่จะสร้าง

แบ่งส่วน ตามลำดับ การดำเนินการ
แบ่งการนับออกเป็นชิ้น ๆ ที่จะมีขนาดไม่เกิน m MB ของ
หน่วยความจำหรือเป็น n ชิ้นที่มีขนาดเท่ากัน แต่ละชิ้นถูกคำนวณตามลำดับ
และผลลัพธ์จะถูกรวมเข้าด้วยกันในตอนท้าย หนึ่งเดียวใน - หน่วยความจำ และ -กลุ่ม is
จำเป็น

- หน่วยความจำ m
ใช้มากที่สุด m หน่วยความจำ MB ต่อเซ็กเมนต์

-กลุ่ม n
ใช้ n กลุ่ม

แบ่งส่วน เป็นกลุ่ม การดำเนินการ
เหมือนกับลำดับ ยกเว้นสิ่งนี้ทำให้แต่ละส่วนสามารถดำเนินการได้ด้วยตนเอง
ในแบบคู่ขนาน. หนึ่งเดียวใน - หน่วยความจำ และ -กลุ่ม มันจำเป็น. ดู .ด้วย
ตัวอย่าง ส่วนในหน้านี้

- หน่วยความจำ m
ใช้มากที่สุด m หน่วยความจำ MB ต่อเซ็กเมนต์

-กลุ่ม n
ใช้ n กลุ่ม

-configbatch
สร้างแบทช์

-นับแบทช์ n
เรียกใช้หมายเลขชุด n

-ผสานแบทช์
รวมแบตช์

โหมดแบตช์สามารถทำงานบนกริดได้

-sge ชื่องาน
ชื่องานเฉพาะสำหรับการดำเนินการนี้ เมอรีล จะส่งงานพร้อมชื่อ
mpชื่องาน, เอ็นซีชื่องาน, นาโนเมตรชื่องานสำหรับขั้นตอนการเตรียม นับและรวม

-sgebuild "ตัวเลือก"

-sgemerge "ตัวเลือก"
ตัวเลือกเพิ่มเติมเพื่อ คิวซับ(1) (เช่น "-p -153 -วิชาพลศึกษา ด้าย2 -A
merylaccount") NB - -N จะถูกละเว้น NB - อย่าลืมอ้างอิง
ตัวเลือก

-M ระบุรายการของตาราง ดำเนินการทางคณิตศาสตร์ ตรรกะ หรือขีดจำกัด เว้นแต่
ระบุไว้ การดำเนินการทั้งหมดใช้ฐานข้อมูลจำนวนเท่าใดก็ได้ การดำเนินการทางคณิตศาสตร์คือ:

นาที count คือจำนวนขั้นต่ำสำหรับฐานข้อมูลทั้งหมด ถ้าแมร์ไม่มีอยู่ใน
ฐานข้อมูลทั้งหมด mer มีการนับศูนย์และไม่ได้อยู่ในเอาต์พุต

mineexist
count คือจำนวนขั้นต่ำสำหรับฐานข้อมูลทั้งหมดที่มี mer

แม็กซ์ count คือจำนวนสูงสุดของฐานข้อมูลทั้งหมด

เพิ่ม count คือผลรวมของการนับสำหรับฐานข้อมูลทั้งหมด

ด้านล่าง นับเป็นครั้งแรกลบวินาที (ไบนารีเท่านั้น)

เอบีเอส count คือค่าสัมบูรณ์ของค่าแรกลบค่าที่สอง (ไบนารีเท่านั้น)

การดำเนินการทางตรรกะคือ:

และ ผลลัพธ์ mer if มันมีอยู่ในฐานข้อมูลทั้งหมด

NAND ผลลัพธ์ mer หากมีอยู่ในฐานข้อมูลอย่างน้อยหนึ่งฐานข้อมูล แต่ไม่ใช่ทั้งหมด

or ผลลัพธ์ mer หากมีอยู่ในฐานข้อมูลอย่างน้อยหนึ่งฐานข้อมูล

ซอร์ ผลลัพธ์ mer ถ้ามันมีอยู่ในฐานข้อมูลจำนวนคี่

การดำเนินการตามเกณฑ์คือ:

น้อยกว่า x
เอาท์พุต mer ถ้ามันมีการนับ < x

น้อยกว่าเท่ากัน x
ผลลัพธ์ mer ถ้ามันมีการนับ <= x

มากกว่า x
เอาท์พุต mer ถ้ามันมีการนับ > x

มากกว่าเท่ากัน x
เอาท์พุต mer ถ้ามันมีการนับ >= x

เท่ากัน x
ผลลัพธ์ mer ถ้ามีการนับ == x

การดำเนินการตามเกณฑ์ทำงานบนฐานข้อมูลเดียว

-s tblคำนำหน้า
ใช้ tblคำนำหน้า เป็นฐานข้อมูล

-o tblคำนำหน้า
สร้างผลลัพธ์นี้

-v ให้ความบันเทิงแก่ผู้ใช้

-D ตารางการถ่ายโอนข้อมูล (ไม่ใช่ทั้งหมด)

-พ ทิ้งฮิสโตแกรมของระยะห่างระหว่างเมอร์ตัวเดียวกัน

-ด.ต ทิ้ง mers >= ธรณีประตู ใช้ -n เพื่อระบุเกณฑ์

-กระแสตรง นับจำนวน mers mers ที่แตกต่างกันและ mers ที่ไม่ซ้ำกัน

-ด.ช ดัมพ์ (เป็น stdout) ฮิสโตแกรมของ mer นับ

-s อ่านตารางการนับจากที่นี่ (ทิ้ง .mcdat หรือ .mcidx)

ตัวอย่าง


ชุด การสร้าง of a ตาราง
เริ่มต้นการคำนวณด้วย -configbatchซึ่งต้องการตัวเลือกการสร้างทั้งหมด ดำเนินการทั้งหมด
-นับแบทช์ งานแล้ว -ผสานแบทช์ ให้เสร็จสมบูรณ์

เมอรีล -configbatch -B [ตัวเลือก] -o ไฟล์
เมอรีล -นับแบทช์ 0 -o ไฟล์
เมอรีล -นับแบทช์ 1 -o ไฟล์
...
เมอรีล -นับแบทช์ N -o ไฟล์
เมอรีล -ผสานแบทช์ N -o ไฟล์

ใช้เมอริลออนไลน์โดยใช้บริการ onworks.net



โปรแกรมออนไลน์ Linux และ Windows ล่าสุด