ภาษาอังกฤษภาษาฝรั่งเศสสเปน

Ad


ไอคอน Fav ของ OnWorks

cmcalibrate - ออนไลน์ในคลาวด์

เรียกใช้ cmcalibrate ในผู้ให้บริการโฮสต์ฟรีของ OnWorks ผ่าน Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

นี่คือคำสั่ง cmcalibrate ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

โครงการ:

ชื่อ


cmcalibrate - ปรับหางเลขชี้กำลังให้พอดีสำหรับแบบจำลองความแปรปรวนร่วม การกำหนดค่า E-value

เรื่องย่อ


ซม.ปรับเทียบ [ตัวเลือก] ซมไฟล์

DESCRIPTION


ซม.ปรับเทียบ กำหนดพารามิเตอร์หางเลขชี้กำลังสำหรับการกำหนดค่า E โดยการสร้าง
สุ่มลำดับการค้นหาด้วย CM และรวบรวมคะแนนของผลลัพธ์
ฮิต ฮิสโตแกรมของคะแนนบิตของการตีนั้นพอดีกับส่วนท้ายเลขชี้กำลังและ
พารามิเตอร์ของหางที่พอดีจะถูกบันทึกลงในไฟล์ CM พารามิเตอร์หางเลขชี้กำลัง
ใช้ในการประเมินนัยสำคัญทางสถิติของจำนวนครั้งที่พบใน ค้นหา cm และ
ซม.สแกน

ไฟล์ CM ต้องสอบเทียบด้วย ซม.ปรับเทียบ ก่อนนำไปใช้ใน ค้นหา cm or ซีเอ็มสแกน,
มีข้อยกเว้นเพียงข้อเดียว: ไม่จำเป็นต้องปรับเทียบไฟล์ CM ที่มีเฉพาะ
รุ่นที่ไม่มีเบสคู่ก่อนวิ่ง ค้นหาซม.

ซม.ปรับเทียบ ช้ามาก ใช้เวลาสองสามชั่วโมงในการปรับเทียบขนาดเฉลี่ยเดียว
CM บน CPU ตัวเดียว ซม.ปรับเทียบ จะทำงานแบบขนานบนคอร์ที่มีอยู่ทั้งหมดหาก Infernal
สร้างขึ้นบนระบบที่รองรับเธรด POSIX (ดูส่วนการติดตั้งของ
คู่มือผู้ใช้สำหรับข้อมูลเพิ่มเติม) โดยใช้ แกนจะส่งผลให้ประมาณ -พับ
การเร่งความเร็วเทียบกับ CPU ตัวเดียว MPI (Message Passing Interface) สามารถใช้สำหรับ
ขนานกับ --mpi ตัวเลือกหาก Infernal ถูกสร้างโดยเปิดใช้งาน MPI แต่ใช้
ไม่แนะนำให้ใช้โปรเซสเซอร์มากกว่า 161 ตัวเนื่องจากการเพิ่มขึ้นที่ผ่านมา 161 จะไม่เร่งความเร็ว
การสอบเทียบ ดูส่วนการติดตั้งของคู่มือผู้ใช้สำหรับข้อมูลเพิ่มเติม

พื้นที่ --พยากรณ์ สามารถใช้ตัวเลือกเพื่อประมาณระยะเวลาที่โปรแกรมจะทำงานสำหรับ a
กำหนด ซมไฟล์ บนเครื่องปัจจุบัน เพื่อทำนายเวลาทำงานบน โปรเซสเซอร์ที่มี
MPI นอกจากนี้ยังใช้ --nพยากรณ์ ตัวเลือก

ลำดับสุ่มค้นหาใน ซม.ปรับเทียบ ถูกสร้างขึ้นโดย HMM ที่ได้รับการฝึกอบรมเกี่ยวกับ
ลำดับจีโนมจริงที่มีเนื้อหา GC ต่างๆ เป้าหมายคือการมีการกระจาย GC
ในลำดับสุ่มจะคล้ายกับลำดับจีโนมที่เกิดขึ้นจริง

การค้นหาสี่รอบและการปรับหางเลขชี้กำลังที่ตามมาจะถูกดำเนินการ อย่างละหนึ่งรายการสำหรับ
สี่อัลกอริธึม CM ที่แตกต่างกันที่สามารถใช้ได้ใน ค้นหา cm และ ซมสแกน: CYK โกลคอล,
glocal Inside, CYK ท้องถิ่นและ Inside ภายใน

พารามิเตอร์ E-values ​​กำหนดโดย ซม.ปรับเทียบ ใช้โดย .เท่านั้น ค้นหา cm และ ซม.สแกน
โปรแกรม หากคุณจะไม่ใช้โปรแกรมเหล่านี้ก็ไม่ต้องเสียเวลาในการปรับเทียบมาตรฐาน
โมเดลของคุณ

OPTIONS


-h ช่วย; พิมพ์การแจ้งเตือนสั้นๆ เกี่ยวกับการใช้บรรทัดคำสั่งและตัวเลือกที่มี

-L กำหนดความยาวรวมของลำดับสุ่มเพื่อค้นหา เมกะเบส (Mb) โดย
ค่าเริ่มต้น, is 1.6 เมกะไบต์ เพิ่มขึ้น จะทำให้หางเลขชี้กำลังพอดีมากขึ้น
แม่นยำและค่า E แม่นยำกว่าแต่ใช้เวลานานกว่า (สองเท่า จะประมาณ
เวลาทำงานสองเท่า) ลดลง ไม่แนะนำเพราะจะทำให้
เหมาะกับความแม่นยำน้อยกว่าและค่า E แม่นยำน้อยกว่า

OPTIONS สำหรับ ทำนาย ที่จำเป็น เวลา AND หน่วยความจำ


--พยากรณ์
คาดการณ์เวลาที่ใช้ในการสอบเทียบของ ซมไฟล์ (พร้อมตัวเลือกที่ให้มา) บน
เครื่องปัจจุบันและออก ไม่ได้ทำการปรับเทียบ คำทำนาย
ควรพิจารณาประมาณการคร่าวๆ หากเปิดใช้งานมัลติเธรด (ดู
ส่วนการติดตั้งของคู่มือผู้ใช้) เวลาจะคำนึงถึงหมายเลข
ของแกนที่มีอยู่

--nพยากรณ์
กับ --พยากรณ์, ระบุว่า โปรเซสเซอร์จะใช้สำหรับการสอบเทียบ
สิ่งนี้อาจมีประโยชน์สำหรับการคาดคะเนเวลาทำงานของ MPI ที่รันด้วย
โปรเซสเซอร์

--memreq
คาดการณ์จำนวนหน่วยความจำที่จำเป็นสำหรับการสอบเทียบ ซมไฟล์ (พร้อมให้
ตัวเลือก) บนเครื่องปัจจุบันและออก ไม่ได้ทำการปรับเทียบ

OPTIONS การควบคุม เอกซ์โพเนนเชียล หาง พอดี


--gtailn
ใส่หางเลขชี้กำลังสำหรับ glocal Inside และ glocal CYK ถึง คะแนนสูงสุด
ในฮิสโตแกรมหางโดยที่ is คูณด้วยจำนวนการค้นหา Mb NS
ค่าเริ่มต้นของ คือ 250 เลือกค่า 250 เพราะใช้ได้ดี
เชิงประจักษ์เทียบกับค่าอื่นๆ

--ltailn
พอดีกับหางเลขชี้กำลังสำหรับ Inside ในพื้นที่และ CYK ในพื้นที่ถึง คะแนนสูงสุด
ในฮิสโตแกรมหางโดยที่ is คูณด้วยจำนวนการค้นหา Mb NS
ค่าเริ่มต้นของ คือ 750 เลือกค่า 750 เพราะใช้ได้ดี
เชิงประจักษ์เทียบกับค่าอื่นๆ

--หาง
ไม่ต้องสนใจ --gtailn และ --ltailn ตัวเลือกนำหน้าและพอดีกับ เศษส่วนหางของ
ฮิสโตแกรมเป็นหางเลขชี้กำลัง สำหรับโหมดการค้นหาทั้งหมด

ตัวเลือก เอาท์พุท ไฟล์


--hfile
บันทึกฮิสโตแกรมให้พอดีกับไฟล์ . รูปแบบของไฟล์นี้คือสองช่องว่าง
คอลัมน์คั่นต่อบรรทัด คอลัมน์แรกคือค่าแกน x ของคะแนนบิตของ
แต่ละถัง คอลัมน์ที่สองคือค่าแกน y ของจำนวน Hit ต่อถัง แต่ละ
ซีรีส์คั่นด้วยบรรทัดที่มีอักขระตัวเดียว "&" ไฟล์จะมี
หนึ่งชุดสำหรับหางเลขชี้กำลังสี่แต่ละตัวจะเรียงตามลำดับต่อไปนี้:
glocal CYK, glocal Inside, CYK ในเครื่อง และ Inside ภายใน

--sfile
บันทึกข้อมูลแผนการเอาตัวรอดลงในไฟล์ . รูปแบบของไฟล์นี้คือสองช่องว่าง
คอลัมน์คั่นต่อบรรทัด คอลัมน์แรกคือค่าแกน x ของคะแนนบิตของ
แต่ละถัง คอลัมน์ที่สองคือค่าแกน y ของเศษส่วนของ Hit ที่ตรงกับหรือ
เกินคะแนนสำหรับแต่ละถัง แต่ละชุดคั่นด้วยบรรทัดเดียว
อักขระ "&". ไฟล์จะมีข้อมูลสามชุดสำหรับแต่ละCM
โหมดการค้นหาตามลำดับต่อไปนี้: glocal CYK, glocal Inside, CYK ในเครื่อง และ
ภายในท้องถิ่น ชุดแรกคือพล็อตการเอาตัวรอดเชิงประจักษ์จากฮิสโตแกรม
ของการโจมตีตามลำดับแบบสุ่ม ชุดที่สองคือหางเลขชี้กำลังพอดี
การกระจายเชิงประจักษ์ ชุดที่สามคือหางแบบเลขชี้กำลังพอดีถ้าแลมบ์ดา
ได้รับการแก้ไขและตั้งค่าเป็นล็อกธรรมชาติของ 2 (0.691314718)

--qqfile
บันทึกข้อมูลพล็อตควอนไทล์-ควอนไทล์ลงในไฟล์ . รูปแบบของไฟล์นี้คือ
สองคอลัมน์คั่นด้วยช่องว่างต่อบรรทัด คอลัมน์แรกคือค่าแกน x และ
คอลัมน์ที่สองคือค่าแกน y ระยะห่างของจุดจาก
เส้นเอกลักษณ์ (y=x) เป็นตัววัดความพอดีของหางแบบเอ็กซ์โปเนนเชียล
จุดที่ใกล้ชิดกับเส้นอัตลักษณ์มากเท่าไร ความพอดีก็จะยิ่งดีขึ้นเท่านั้น แต่ละชุดคือ
คั่นด้วยบรรทัดที่มีอักขระตัวเดียว "&" ไฟล์จะมีหนึ่งชุด
ของข้อมูลเชิงประจักษ์สำหรับหางเลขชี้กำลังสี่แต่ละตัวดังต่อไปนี้
ลำดับ: glocal CYK, glocal Inside, CYK ในเครื่อง และ Local Inside

--ไฟล์
ประหยัดพื้นที่สถิติตัวคั่นของหางเลขชี้กำลังที่แตกต่างกันพอดีกับไฟล์ .
ไฟล์จะมีค่าแลมบ์ดาและ mu สำหรับหางเลขชี้กำลังพอดี
ฮิสโตแกรมหางขนาดต่างๆ ฟิลด์ในไฟล์มีป้ายกำกับว่า
ข้อมูล

--xfile
บันทึกรายการคะแนนในแต่ละฮิสโตแกรมให้พอดีกับไฟล์ . แต่ละบรรทัดของ
ไฟล์นี้จะมีคะแนนที่แตกต่างกันซึ่งบ่งชี้ว่ามีการตีหนึ่งครั้งที่ส่วนท้ายด้วย
คะแนนนั้น แต่ละชุดคั่นด้วยบรรทัดที่มีอักขระตัวเดียว "&" NS
ไฟล์จะมีหนึ่งชุดสำหรับแต่ละหางเลขชี้กำลังสี่ตัวที่พอดีใน
ลำดับต่อไปนี้: glocal CYK, glocal Inside, CYK ในเครื่อง และ Inside ภายใน

อื่น ๆ OPTIONS


--เมล็ด
เมล็ดพันธุ์เครื่องกำเนิดตัวเลขสุ่มด้วย , จำนวนเต็ม >= 0 ถ้า ไม่เป็นศูนย์
การจำลองสุ่มจะทำซ้ำได้ คำสั่งเดียวกันจะให้เหมือนกัน
ผลลัพธ์. ถ้า คือ 0 ตัวสร้างตัวเลขสุ่มจะถูกเพาะโดยพลการและ
การจำลองแบบสุ่มจะแตกต่างกันไปตามการเรียกใช้คำสั่งเดียวกัน ค่าเริ่มต้น
เมล็ดคือ 181

--เบต้า
โดยค่าเริ่มต้นแถบที่ขึ้นกับข้อความค้นหา (QDB) จะใช้เพื่อเร่งการค้นหา CM
อัลกอริธึมที่มีความน่าจะเป็นการสูญเสียหางเบต้าที่ 1E-15 ค่าเบต้านี้สามารถ
เปลี่ยนไปเป็น กับ --เบต้า . พารามิเตอร์เบต้าคือจำนวนความน่าจะเป็น
ไม่รวมมวลระหว่างการคำนวณแบนด์ ค่าเบต้าที่สูงขึ้นจะให้ความเร็วที่มากขึ้น
แต่เสียสละความแม่นยำมากกว่าค่าที่ต่ำกว่า ค่าเริ่มต้นที่ใช้คือ 1E-15
(สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ QDB โปรดดูที่ Nawrocki and Eddy, PLoS Computational Biology
3(3):e56.)

--ไม่มีแบนด์
ปิด QDB ระหว่างการปรับเทียบค่า E ซึ่งจะทำให้การสอบเทียบช้าลง

--ไม่มีค่าว่าง3
ปิดโมเดล null เพิ่มเติม null3 post hoc ไม่แนะนำเว้นแต่
คุณวางแผนที่จะใช้ตัวเลือกเดียวกันกับ ค้นหา cm และ / หรือ ซม.สแกน

--สุ่ม
ใช้โมเดล null พื้นหลังของ CM เพื่อสร้างลำดับแบบสุ่มแทน
ของ HMM ที่สมจริงยิ่งขึ้น เว้นแต่ CM จะถูกสร้างขึ้นโดยใช้ --โมฆะ ตัวเลือก
ซมบิลด์, โมเดล null พื้นหลังจะเป็น 25% ในแต่ละ A, C, G และ U

--gc
สร้างลำดับสุ่มโดยใช้การกระจายนิวคลีโอไทด์จากลำดับ
ไฟล์ .

--ซีพียู
ระบุว่า ใช้คนงาน CPU แบบขนาน ถ้า ถูกกำหนดเป็น "0" จากนั้น
โปรแกรมจะทำงานในโหมดซีเรียลโดยไม่ต้องใช้เธรด คุณยังสามารถควบคุม
ตัวเลขนี้โดยการตั้งค่าตัวแปรสภาพแวดล้อม INFERNAL_NCPU ตัวเลือกนี้จะ
ใช้ได้เฉพาะในกรณีที่เครื่องที่ Infernal สร้างขึ้นนั้นสามารถใช้งานได้
เกลียว POSIX (ดูส่วนการติดตั้งของคู่มือผู้ใช้สำหรับข้อมูลเพิ่มเติม
ข้อมูล).

--mpi เรียกใช้เป็นโปรแกรม MPI แบบขนาน ตัวเลือกนี้จะใช้ได้ก็ต่อเมื่อ Infernal มี
ได้รับการกำหนดค่าและสร้างด้วยแฟล็ก "--enable-mpi" (ดู Installation
ของคู่มือผู้ใช้สำหรับข้อมูลเพิ่มเติม)

ใช้ cmcalibrate ออนไลน์โดยใช้บริการ onworks.net


เซิร์ฟเวอร์และเวิร์กสเตชันฟรี

ดาวน์โหลดแอพ Windows & Linux

คำสั่ง Linux

Ad