นี่คือคำสั่ง cmcalibrate ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
cmcalibrate - ปรับหางเลขชี้กำลังให้พอดีสำหรับแบบจำลองความแปรปรวนร่วม การกำหนดค่า E-value
เรื่องย่อ
ซม.ปรับเทียบ [ตัวเลือก] ซมไฟล์
DESCRIPTION
ซม.ปรับเทียบ กำหนดพารามิเตอร์หางเลขชี้กำลังสำหรับการกำหนดค่า E โดยการสร้าง
สุ่มลำดับการค้นหาด้วย CM และรวบรวมคะแนนของผลลัพธ์
ฮิต ฮิสโตแกรมของคะแนนบิตของการตีนั้นพอดีกับส่วนท้ายเลขชี้กำลังและ
พารามิเตอร์ของหางที่พอดีจะถูกบันทึกลงในไฟล์ CM พารามิเตอร์หางเลขชี้กำลัง
ใช้ในการประเมินนัยสำคัญทางสถิติของจำนวนครั้งที่พบใน ค้นหา cm และ
ซม.สแกน
ไฟล์ CM ต้องสอบเทียบด้วย ซม.ปรับเทียบ ก่อนนำไปใช้ใน ค้นหา cm or ซีเอ็มสแกน,
มีข้อยกเว้นเพียงข้อเดียว: ไม่จำเป็นต้องปรับเทียบไฟล์ CM ที่มีเฉพาะ
รุ่นที่ไม่มีเบสคู่ก่อนวิ่ง ค้นหาซม.
ซม.ปรับเทียบ ช้ามาก ใช้เวลาสองสามชั่วโมงในการปรับเทียบขนาดเฉลี่ยเดียว
CM บน CPU ตัวเดียว ซม.ปรับเทียบ จะทำงานแบบขนานบนคอร์ที่มีอยู่ทั้งหมดหาก Infernal
สร้างขึ้นบนระบบที่รองรับเธรด POSIX (ดูส่วนการติดตั้งของ
คู่มือผู้ใช้สำหรับข้อมูลเพิ่มเติม) โดยใช้ แกนจะส่งผลให้ประมาณ -พับ
การเร่งความเร็วเทียบกับ CPU ตัวเดียว MPI (Message Passing Interface) สามารถใช้สำหรับ
ขนานกับ --mpi ตัวเลือกหาก Infernal ถูกสร้างโดยเปิดใช้งาน MPI แต่ใช้
ไม่แนะนำให้ใช้โปรเซสเซอร์มากกว่า 161 ตัวเนื่องจากการเพิ่มขึ้นที่ผ่านมา 161 จะไม่เร่งความเร็ว
การสอบเทียบ ดูส่วนการติดตั้งของคู่มือผู้ใช้สำหรับข้อมูลเพิ่มเติม
พื้นที่ --พยากรณ์ สามารถใช้ตัวเลือกเพื่อประมาณระยะเวลาที่โปรแกรมจะทำงานสำหรับ a
กำหนด ซมไฟล์ บนเครื่องปัจจุบัน เพื่อทำนายเวลาทำงานบน โปรเซสเซอร์ที่มี
MPI นอกจากนี้ยังใช้ --nพยากรณ์ ตัวเลือก
ลำดับสุ่มค้นหาใน ซม.ปรับเทียบ ถูกสร้างขึ้นโดย HMM ที่ได้รับการฝึกอบรมเกี่ยวกับ
ลำดับจีโนมจริงที่มีเนื้อหา GC ต่างๆ เป้าหมายคือการมีการกระจาย GC
ในลำดับสุ่มจะคล้ายกับลำดับจีโนมที่เกิดขึ้นจริง
การค้นหาสี่รอบและการปรับหางเลขชี้กำลังที่ตามมาจะถูกดำเนินการ อย่างละหนึ่งรายการสำหรับ
สี่อัลกอริธึม CM ที่แตกต่างกันที่สามารถใช้ได้ใน ค้นหา cm และ ซมสแกน: CYK โกลคอล,
glocal Inside, CYK ท้องถิ่นและ Inside ภายใน
พารามิเตอร์ E-values กำหนดโดย ซม.ปรับเทียบ ใช้โดย .เท่านั้น ค้นหา cm และ ซม.สแกน
โปรแกรม หากคุณจะไม่ใช้โปรแกรมเหล่านี้ก็ไม่ต้องเสียเวลาในการปรับเทียบมาตรฐาน
โมเดลของคุณ
OPTIONS
-h ช่วย; พิมพ์การแจ้งเตือนสั้นๆ เกี่ยวกับการใช้บรรทัดคำสั่งและตัวเลือกที่มี
-L กำหนดความยาวรวมของลำดับสุ่มเพื่อค้นหา เมกะเบส (Mb) โดย
ค่าเริ่มต้น, is 1.6 เมกะไบต์ เพิ่มขึ้น จะทำให้หางเลขชี้กำลังพอดีมากขึ้น
แม่นยำและค่า E แม่นยำกว่าแต่ใช้เวลานานกว่า (สองเท่า จะประมาณ
เวลาทำงานสองเท่า) ลดลง ไม่แนะนำเพราะจะทำให้
เหมาะกับความแม่นยำน้อยกว่าและค่า E แม่นยำน้อยกว่า
OPTIONS สำหรับ ทำนาย ที่จำเป็น เวลา AND หน่วยความจำ
--พยากรณ์
คาดการณ์เวลาที่ใช้ในการสอบเทียบของ ซมไฟล์ (พร้อมตัวเลือกที่ให้มา) บน
เครื่องปัจจุบันและออก ไม่ได้ทำการปรับเทียบ คำทำนาย
ควรพิจารณาประมาณการคร่าวๆ หากเปิดใช้งานมัลติเธรด (ดู
ส่วนการติดตั้งของคู่มือผู้ใช้) เวลาจะคำนึงถึงหมายเลข
ของแกนที่มีอยู่
--nพยากรณ์
กับ --พยากรณ์, ระบุว่า โปรเซสเซอร์จะใช้สำหรับการสอบเทียบ
สิ่งนี้อาจมีประโยชน์สำหรับการคาดคะเนเวลาทำงานของ MPI ที่รันด้วย
โปรเซสเซอร์
--memreq
คาดการณ์จำนวนหน่วยความจำที่จำเป็นสำหรับการสอบเทียบ ซมไฟล์ (พร้อมให้
ตัวเลือก) บนเครื่องปัจจุบันและออก ไม่ได้ทำการปรับเทียบ
OPTIONS การควบคุม เอกซ์โพเนนเชียล หาง พอดี
--gtailn
ใส่หางเลขชี้กำลังสำหรับ glocal Inside และ glocal CYK ถึง คะแนนสูงสุด
ในฮิสโตแกรมหางโดยที่ is คูณด้วยจำนวนการค้นหา Mb NS
ค่าเริ่มต้นของ คือ 250 เลือกค่า 250 เพราะใช้ได้ดี
เชิงประจักษ์เทียบกับค่าอื่นๆ
--ltailn
พอดีกับหางเลขชี้กำลังสำหรับ Inside ในพื้นที่และ CYK ในพื้นที่ถึง คะแนนสูงสุด
ในฮิสโตแกรมหางโดยที่ is คูณด้วยจำนวนการค้นหา Mb NS
ค่าเริ่มต้นของ คือ 750 เลือกค่า 750 เพราะใช้ได้ดี
เชิงประจักษ์เทียบกับค่าอื่นๆ
--หาง
ไม่ต้องสนใจ --gtailn และ --ltailn ตัวเลือกนำหน้าและพอดีกับ เศษส่วนหางของ
ฮิสโตแกรมเป็นหางเลขชี้กำลัง สำหรับโหมดการค้นหาทั้งหมด
ตัวเลือก เอาท์พุท ไฟล์
--hfile
บันทึกฮิสโตแกรมให้พอดีกับไฟล์ . รูปแบบของไฟล์นี้คือสองช่องว่าง
คอลัมน์คั่นต่อบรรทัด คอลัมน์แรกคือค่าแกน x ของคะแนนบิตของ
แต่ละถัง คอลัมน์ที่สองคือค่าแกน y ของจำนวน Hit ต่อถัง แต่ละ
ซีรีส์คั่นด้วยบรรทัดที่มีอักขระตัวเดียว "&" ไฟล์จะมี
หนึ่งชุดสำหรับหางเลขชี้กำลังสี่แต่ละตัวจะเรียงตามลำดับต่อไปนี้:
glocal CYK, glocal Inside, CYK ในเครื่อง และ Inside ภายใน
--sfile
บันทึกข้อมูลแผนการเอาตัวรอดลงในไฟล์ . รูปแบบของไฟล์นี้คือสองช่องว่าง
คอลัมน์คั่นต่อบรรทัด คอลัมน์แรกคือค่าแกน x ของคะแนนบิตของ
แต่ละถัง คอลัมน์ที่สองคือค่าแกน y ของเศษส่วนของ Hit ที่ตรงกับหรือ
เกินคะแนนสำหรับแต่ละถัง แต่ละชุดคั่นด้วยบรรทัดเดียว
อักขระ "&". ไฟล์จะมีข้อมูลสามชุดสำหรับแต่ละCM
โหมดการค้นหาตามลำดับต่อไปนี้: glocal CYK, glocal Inside, CYK ในเครื่อง และ
ภายในท้องถิ่น ชุดแรกคือพล็อตการเอาตัวรอดเชิงประจักษ์จากฮิสโตแกรม
ของการโจมตีตามลำดับแบบสุ่ม ชุดที่สองคือหางเลขชี้กำลังพอดี
การกระจายเชิงประจักษ์ ชุดที่สามคือหางแบบเลขชี้กำลังพอดีถ้าแลมบ์ดา
ได้รับการแก้ไขและตั้งค่าเป็นล็อกธรรมชาติของ 2 (0.691314718)
--qqfile
บันทึกข้อมูลพล็อตควอนไทล์-ควอนไทล์ลงในไฟล์ . รูปแบบของไฟล์นี้คือ
สองคอลัมน์คั่นด้วยช่องว่างต่อบรรทัด คอลัมน์แรกคือค่าแกน x และ
คอลัมน์ที่สองคือค่าแกน y ระยะห่างของจุดจาก
เส้นเอกลักษณ์ (y=x) เป็นตัววัดความพอดีของหางแบบเอ็กซ์โปเนนเชียล
จุดที่ใกล้ชิดกับเส้นอัตลักษณ์มากเท่าไร ความพอดีก็จะยิ่งดีขึ้นเท่านั้น แต่ละชุดคือ
คั่นด้วยบรรทัดที่มีอักขระตัวเดียว "&" ไฟล์จะมีหนึ่งชุด
ของข้อมูลเชิงประจักษ์สำหรับหางเลขชี้กำลังสี่แต่ละตัวดังต่อไปนี้
ลำดับ: glocal CYK, glocal Inside, CYK ในเครื่อง และ Local Inside
--ไฟล์
ประหยัดพื้นที่สถิติตัวคั่นของหางเลขชี้กำลังที่แตกต่างกันพอดีกับไฟล์ .
ไฟล์จะมีค่าแลมบ์ดาและ mu สำหรับหางเลขชี้กำลังพอดี
ฮิสโตแกรมหางขนาดต่างๆ ฟิลด์ในไฟล์มีป้ายกำกับว่า
ข้อมูล
--xfile
บันทึกรายการคะแนนในแต่ละฮิสโตแกรมให้พอดีกับไฟล์ . แต่ละบรรทัดของ
ไฟล์นี้จะมีคะแนนที่แตกต่างกันซึ่งบ่งชี้ว่ามีการตีหนึ่งครั้งที่ส่วนท้ายด้วย
คะแนนนั้น แต่ละชุดคั่นด้วยบรรทัดที่มีอักขระตัวเดียว "&" NS
ไฟล์จะมีหนึ่งชุดสำหรับแต่ละหางเลขชี้กำลังสี่ตัวที่พอดีใน
ลำดับต่อไปนี้: glocal CYK, glocal Inside, CYK ในเครื่อง และ Inside ภายใน
อื่น ๆ OPTIONS
--เมล็ด
เมล็ดพันธุ์เครื่องกำเนิดตัวเลขสุ่มด้วย , จำนวนเต็ม >= 0 ถ้า ไม่เป็นศูนย์
การจำลองสุ่มจะทำซ้ำได้ คำสั่งเดียวกันจะให้เหมือนกัน
ผลลัพธ์. ถ้า คือ 0 ตัวสร้างตัวเลขสุ่มจะถูกเพาะโดยพลการและ
การจำลองแบบสุ่มจะแตกต่างกันไปตามการเรียกใช้คำสั่งเดียวกัน ค่าเริ่มต้น
เมล็ดคือ 181
--เบต้า
โดยค่าเริ่มต้นแถบที่ขึ้นกับข้อความค้นหา (QDB) จะใช้เพื่อเร่งการค้นหา CM
อัลกอริธึมที่มีความน่าจะเป็นการสูญเสียหางเบต้าที่ 1E-15 ค่าเบต้านี้สามารถ
เปลี่ยนไปเป็น กับ --เบต้า . พารามิเตอร์เบต้าคือจำนวนความน่าจะเป็น
ไม่รวมมวลระหว่างการคำนวณแบนด์ ค่าเบต้าที่สูงขึ้นจะให้ความเร็วที่มากขึ้น
แต่เสียสละความแม่นยำมากกว่าค่าที่ต่ำกว่า ค่าเริ่มต้นที่ใช้คือ 1E-15
(สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ QDB โปรดดูที่ Nawrocki and Eddy, PLoS Computational Biology
3(3):e56.)
--ไม่มีแบนด์
ปิด QDB ระหว่างการปรับเทียบค่า E ซึ่งจะทำให้การสอบเทียบช้าลง
--ไม่มีค่าว่าง3
ปิดโมเดล null เพิ่มเติม null3 post hoc ไม่แนะนำเว้นแต่
คุณวางแผนที่จะใช้ตัวเลือกเดียวกันกับ ค้นหา cm และ / หรือ ซม.สแกน
--สุ่ม
ใช้โมเดล null พื้นหลังของ CM เพื่อสร้างลำดับแบบสุ่มแทน
ของ HMM ที่สมจริงยิ่งขึ้น เว้นแต่ CM จะถูกสร้างขึ้นโดยใช้ --โมฆะ ตัวเลือก
ซมบิลด์, โมเดล null พื้นหลังจะเป็น 25% ในแต่ละ A, C, G และ U
--gc
สร้างลำดับสุ่มโดยใช้การกระจายนิวคลีโอไทด์จากลำดับ
ไฟล์ .
--ซีพียู
ระบุว่า ใช้คนงาน CPU แบบขนาน ถ้า ถูกกำหนดเป็น "0" จากนั้น
โปรแกรมจะทำงานในโหมดซีเรียลโดยไม่ต้องใช้เธรด คุณยังสามารถควบคุม
ตัวเลขนี้โดยการตั้งค่าตัวแปรสภาพแวดล้อม INFERNAL_NCPU ตัวเลือกนี้จะ
ใช้ได้เฉพาะในกรณีที่เครื่องที่ Infernal สร้างขึ้นนั้นสามารถใช้งานได้
เกลียว POSIX (ดูส่วนการติดตั้งของคู่มือผู้ใช้สำหรับข้อมูลเพิ่มเติม
ข้อมูล).
--mpi เรียกใช้เป็นโปรแกรม MPI แบบขนาน ตัวเลือกนี้จะใช้ได้ก็ต่อเมื่อ Infernal มี
ได้รับการกำหนดค่าและสร้างด้วยแฟล็ก "--enable-mpi" (ดู Installation
ของคู่มือผู้ใช้สำหรับข้อมูลเพิ่มเติม)
ใช้ cmcalibrate ออนไลน์โดยใช้บริการ onworks.net