นี่คือคำสั่ง hmm2build ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้หนึ่งในเวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
hmm2build - สร้างโปรไฟล์ HMM จากการจัดตำแหน่ง
เรื่องย่อ
อืม2บิลด์ [ตัวเลือก] อืมไฟล์ จัดไฟล์
DESCRIPTION
อืม2บิลด์ อ่านไฟล์การจัดตำแหน่งหลายลำดับ จัดไฟล์ , สร้างโปรไฟล์ใหม่ HMM,
และบันทึก HMM ใน hmmfile
จัดไฟล์ อาจอยู่ใน ClustalW, GCG MSF, SELEX, Stockholm หรือการจัดตำแหน่ง FASTA ที่จัดตำแหน่งไว้
รูปแบบ. ตรวจพบรูปแบบโดยอัตโนมัติ
โดยค่าเริ่มต้น โมเดลได้รับการกำหนดค่าให้ค้นหาการจัดตำแหน่งที่ไม่ทับซ้อนกันอย่างน้อยหนึ่งรายการไปยัง
โมเดลที่สมบูรณ์: การจัดตำแหน่งทั่วโลกหลายแบบตามแบบจำลองและแบบโลคัลด้วย
เคารพในลำดับ ซึ่งคล้ายกับพฤติกรรมของ อืมม โปรแกรม HMMER
1. ในการกำหนดค่าโมเดลสำหรับหลาย ๆ ในประเทศ การจัดตำแหน่งตามแบบจำลองและ
ท้องถิ่นเกี่ยวกับลำดับ a la the old program hmms, ใช้ -f (ส่วน)
ตัวเลือก. บ่อยครั้งกว่านี้ คุณอาจต้องการกำหนดค่าแบบจำลองสำหรับการจัดตำแหน่งส่วนกลางเดียว
(ทั่วโลกเกี่ยวกับทั้งรุ่นและลำดับ) โดยใช้ -g ตัวเลือก; หรือเพื่อกำหนดค่า
โมเดลสำหรับการจัดตำแหน่งท้องถิ่น/ท้องถิ่นเดียว (a la standard Smith/Waterman หรือ old หืม
โปรแกรม) ใช้ -s ตัวเลือก
OPTIONS
-f กำหนดค่าแบบจำลองสำหรับการค้นหาหลายโดเมนต่อลำดับ โดยที่แต่ละโดเมน
สามารถเป็นการจัดตำแหน่งท้องถิ่น (ที่ไม่เป็นชิ้นเป็นอัน) นี้คล้ายกับเก่า hmms โครงการ
ของ HMMER 1
-g กำหนดค่าแบบจำลองสำหรับการค้นหาการจัดตำแหน่งส่วนกลางเดียวไปยังลำดับเป้าหมาย
เปรียบเหมือนเก่า อืม โปรแกรม HMMER 1
-h พิมพ์ความช่วยเหลือสั้น ๆ รวมหมายเลขเวอร์ชันและบทสรุปของตัวเลือกทั้งหมด รวมทั้ง
ตัวเลือกผู้เชี่ยวชาญ
-n ตั้งชื่อนี้ว่า HMM . สามารถเป็นสตริงของอักขระที่ไม่ใช่ช่องว่าง (เช่น one
"คำ"). ไม่มีการจำกัดความยาว (อย่างน้อยไม่ได้กำหนดโดย HMMER; เชลล์ของคุณ
จะบ่นเรื่องความยาวบรรทัดคำสั่งก่อน)
-o บันทึกการจัดตำแหน่งเริ่มต้นใหม่ไปที่ , ในรูปแบบสตอกโฮล์ม คอลัมน์ที่เป็น
กำหนดให้จับคู่สถานะจะถูกทำเครื่องหมายด้วย x ในบรรทัดคำอธิบายประกอบ #=RF ถ้า
อย่างใดอย่างหนึ่ง --มือ or --เร็ว เลือกตัวเลือกการก่อสร้างแล้ว การจัดตำแหน่งอาจ
ได้รับการเปลี่ยนแปลงเล็กน้อยเพื่อให้เข้ากันได้กับการเปลี่ยนแผน 7 ดังนั้นบันทึก
การจัดตำแหน่งสุดท้ายและเปรียบเทียบกับการจัดตำแหน่งเริ่มต้นจะช่วยให้คุณดูสิ่งเหล่านี้ได้
การเปลี่ยนแปลง ดูคู่มือผู้ใช้สำหรับข้อมูลเพิ่มเติมเกี่ยวกับผลข้างเคียงที่ลึกลับนี้
-s กำหนดค่าโมเดลเพื่อค้นหาการจัดตำแหน่งภายในเครื่องเดียวต่อลำดับเป้าหมาย นี้
คล้ายกับอัลกอริทึม Smith/Waterman มาตรฐานหรือ the หืม โปรแกรม HMMER
1.
-A ต่อท้ายโมเดลนี้กับที่มีอยู่ อืมไฟล์ มากกว่าการสร้าง hmmfile มีประโยชน์สำหรับ
การสร้างห้องสมุด HMM (เช่น Pfam)
-F บังคับเขียนทับของที่มีอยู่ hmmfile มิฉะนั้น HMMER จะปฏิเสธที่จะปิดบัง
ไฟล์ HMM ที่มีอยู่ของคุณ เพื่อความปลอดภัย
EXPERT OPTIONS
--อะมิโน
บังคับให้ตีความการจัดตำแหน่งลำดับเป็นลำดับกรดอะมิโน โดยทั่วไป
HMMER จะตรวจจับอัตโนมัติว่าการจัดตำแหน่งเป็นโปรตีนหรือ DNA แต่บางครั้งก็มีการจัดเรียงตัว
มีขนาดเล็กมากจนการตรวจจับอัตโนมัติไม่ชัดเจน ดู --นิวคลีอิก
--อาร์คปรี
ตั้งค่า "สถาปัตยกรรมก่อนหน้า" ที่ใช้โดยการสร้างสถาปัตยกรรม MAP เป็น , ที่ไหน
คือความน่าจะเป็นระหว่าง 0 ถึง 1 พารามิเตอร์นี้ควบคุมค่าเรขาคณิตก่อน
การกระจายตามความยาวของแบบจำลอง เนื่องจาก เพิ่มขึ้น นิยมใช้รุ่นที่ยาวกว่า a
ลำดับความสำคัญ เนื่องจาก ลดลงจะใช้เวลาอนุรักษ์สารตกค้างมากขึ้นในคอลัมน์ที่จะทำให้
คอลัมน์ "ฉันทามติ" คอลัมน์จับคู่ในสถาปัตยกรรมแบบจำลอง ค่าเริ่มต้น 0.85 has
ถูกเลือกอย่างมีเหตุมีผล
--ไบนารี่
เขียน HMM ถึง อืมไฟล์ ในรูปแบบไบนารี HMMER แทนข้อความ ASCII ที่อ่านได้
--cfile
บันทึกการนับการปล่อยและการเปลี่ยนแปลงที่สังเกตได้ไปที่ หลังจากที่สถาปัตยกรรมมี
ถูกกำหนดแล้ว (เช่น หลังจากกำหนดสิ่งตกค้าง/ช่องว่างให้จับคู่ ลบ และ
แทรกสถานะ) ตัวเลือกนี้ใช้ในการพัฒนา HMMER สำหรับสร้างไฟล์ข้อมูล
มีประโยชน์สำหรับการฝึกอบรมนักบวช Dirichlet ใหม่ รูปแบบของไฟล์การนับได้รับการบันทึกไว้
ในคู่มือผู้ใช้
--เร็ว กำหนดสถาปัตยกรรมของแบบจำลองอย่างรวดเร็วและแบบศึกษาสำนึกโดยกำหนดทั้งหมด
คอลัมน์จะมากกว่าเศษส่วนของอักขระช่องว่างเพื่อแทรกสถานะ โดย
ค่าเริ่มต้นเศษส่วนนี้คือ 0.5 และสามารถเปลี่ยนได้โดยใช้ --gapmax ตัวเลือก
อัลกอริธึมการก่อสร้างเริ่มต้นคืออัลกอริธึมหลังสูงสุด (MAP) ซึ่งก็คือ
ช้าลง
--gapmax
ควบคุม --เร็ว อัลกอริทึมการสร้างแบบจำลอง แต่ถ้า --เร็ว ไม่ได้ใช้
ไม่มีผล ถ้าคอลัมน์มีมากกว่าเศษส่วน ของสัญลักษณ์ช่องว่างในนั้นมัน
ถูกกำหนดให้กับคอลัมน์แทรก เป็นความถี่ตั้งแต่ 0 ถึง 1 และโดยค่าเริ่มต้น
ถูกตั้งค่าเป็น 0.5 ค่าที่สูงขึ้นของ หมายความว่ามีการมอบหมายคอลัมน์เพิ่มเติมให้กับฉันทามติ
และโมเดลก็ยาวขึ้น ค่าที่น้อยกว่าของ หมายถึงจำนวนคอลัมน์ที่ได้รับมอบหมายให้
ฉันทามติและโมเดลมีขนาดเล็กลง
--มือ ระบุสถาปัตยกรรมของโมเดลด้วยมือ: ไฟล์การจัดตำแหน่งต้องอยู่ใน SELEX
หรือรูปแบบสตอกโฮล์ม และบรรทัดคำอธิบายประกอบอ้างอิง (#=RF ใน SELEX, #=GC RF ใน
สตอกโฮล์ม) ใช้เพื่อระบุสถาปัตยกรรม คอลัมน์ใดๆ ที่มีเครื่องหมาย non-gap
สัญลักษณ์ (เช่น 'x' เป็นต้น) ถูกกำหนดให้เป็นคอลัมน์ฉันทามติ (ตรงกัน) ใน
นางแบบ.
--idlevel
ควบคุมทั้งการกำหนดหมายเลขลำดับที่มีประสิทธิผลและพฤติกรรมของ
--wblosum ตัวเลือกการชั่งน้ำหนัก การจัดตำแหน่งลำดับถูกจัดกลุ่มตามเปอร์เซ็นต์
เอกลักษณ์และจำนวนคลัสเตอร์ที่จุดตัดของ จะใช้ในการ
กำหนดหมายเลขลำดับที่มีประสิทธิภาพ ค่าที่สูงขึ้นของ ให้คลัสเตอร์มากขึ้น
และหมายเลขลำดับที่มีประสิทธิภาพสูงกว่า ค่าที่ต่ำกว่าของ ให้กลุ่มน้อยลงและ
หมายเลขลำดับที่มีประสิทธิภาพต่ำกว่า เป็นเศษส่วนจาก 0 ถึง 1 และโดยค่าเริ่มต้น is
ตั้งค่าเป็น 0.62 (สอดคล้องกับระดับคลัสเตอร์ที่ใช้ในการสร้าง
เมทริกซ์การแทนที่ BLOSUM62)
--ข้อมูล
ยืนยันว่าอินพุต ไฟล์ seq อยู่ในรูปแบบ ; ห้ามเรียกใช้รูปแบบ Babelfish
การตรวจหาอัตโนมัติ สิ่งนี้จะเพิ่มความน่าเชื่อถือของโปรแกรมบ้างเพราะ
Babelfish สามารถทำผิดพลาดได้ แนะนำเป็นพิเศษสำหรับผู้ที่ไม่ต้องดูแล สูง-
ปริมาณงานของ HMMER สตริงรูปแบบที่ถูกต้อง ได้แก่ FASTA, GENBANK, EMBL, GCG,
PIR, สตอกโฮล์ม, SELEX, MSF, CLUSTAL และ PHYLIP ดูคู่มือผู้ใช้สำหรับ a
รายการที่สมบูรณ์
--ไม่มี
ปิดการคำนวณหมายเลขลำดับที่มีประสิทธิผล และใช้จำนวนจริงของ
ลำดับแทน ซึ่งมักจะลดความไวของแบบจำลองสุดท้าย (so
อย่าทำโดยไม่มีเหตุอันควร!)
--นิวคลีอิก
บังคับให้ตีความการจัดตำแหน่งเป็นลำดับกรดนิวคลีอิก ไม่ว่าจะเป็น RNA หรือ DNA
โดยปกติ HMMER จะตรวจจับอัตโนมัติว่าการจัดตำแหน่งเป็นโปรตีนหรือ DNA แต่บางครั้ง
การจัดตำแหน่งมีขนาดเล็กมากจนการตรวจจับอัตโนมัติไม่ชัดเจน ดู --อะมิโน
--โมฆะ
อ่านโมเดล null จาก . ค่าเริ่มต้นสำหรับโปรตีนคือการใช้กรดอะมิโนเฉลี่ย
ความถี่จาก Swissprot 34 และ p1 = 350/351; สำหรับกรดนิวคลีอิก ค่าเริ่มต้นคือto
ใช้ 0.25 สำหรับแต่ละฐานและ p1 = 1000/1001 สำหรับเอกสารเกี่ยวกับรูปแบบของ
ไฟล์โมเดล null และคำอธิบายเพิ่มเติมเกี่ยวกับวิธีการใช้โมเดล null โปรดดูที่
คู่มือผู้ใช้.
--แพม
ใช้ heuristic PAM- (substitution matrix-) ตามการปล่อยการแข่งขันก่อน
ความน่าจะเป็นแทนส่วนผสมเริ่มต้น Dirichlet เมทริกซ์การแทนที่ is
อ่านจาก . ดู --pamwgt.
การเปลี่ยนสถานะ Dirichlet เริ่มต้นก่อนและแทรกการปล่อยก่อน are
ไม่ได้รับผลกระทบ ดังนั้นโดยหลักการแล้วคุณสามารถรวม --ก่อน สีสดสวย --แพม แต่นี่
ไม่แนะนำ เพราะยังไม่ได้ทดสอบ ( --แพม ตัวเองยังไม่ได้รับการทดสอบ
มาก!)
--pamwgt
ควบคุมน้ำหนักบน PAM-based มาก่อน มีผลก็ต่อเมื่อ --แพม ตัวเลือกก็คือ
ในการใช้งาน เป็นจำนวนจริงบวก 20.0 โดยค่าเริ่มต้น คือจำนวน
"pseudocounts" ที่มาจาก heuristic มาก่อน ค่าที่สูงมากของ สามารถ
บังคับระบบการให้คะแนนที่ขับเคลื่อนโดยเมทริกซ์การทดแทนทั้งหมดทำให้
HMMER โปรไฟล์ Gribskov ที่ค่อนข้างใกล้เคียง
--pbswitch
สำหรับการจัดตำแหน่งที่มีลำดับจำนวนมาก GSC, BLOSUM และ Voronoi
แผนการถ่วงน้ำหนักช้า พวกมันคือ O(N^2) สำหรับลำดับ N Henikoff ตามตำแหน่ง
น้ำหนัก (น้ำหนัก PB) มีประสิทธิภาพมากขึ้น ที่หรือสูงกว่าลำดับเกณฑ์ที่กำหนด
จำนวน อืม2บิลด์ จะเปลี่ยนจากน้ำหนัก GSC, BLOSUM หรือ Voronoi เป็น PB
น้ำหนัก หากต้องการปิดใช้งานลักษณะการสลับนี้ (ที่ค่าใช้จ่ายในการคำนวณ ให้ตั้งค่า
เป็นสิ่งที่มากกว่าจำนวนลำดับในการจัดตำแหน่งของคุณ คือ
จำนวนเต็มบวก; ค่าเริ่มต้นคือ 1000
--ก่อน
อ่าน Dirichlet ก่อนจาก , แทนที่ส่วนผสมเริ่มต้น Dirichlet NS
รูปแบบของไฟล์ก่อนหน้าได้รับการบันทึกไว้ในคู่มือผู้ใช้และตัวอย่างจะได้รับใน
ไดเร็กทอรีสาธิตของการแจกจ่าย HMMER
--สเวนทรี
ควบคุมความน่าจะเป็นทั้งหมดที่กระจายไปยังรายการท้องถิ่นในแบบจำลอง
เทียบกับการเริ่มต้นที่จุดเริ่มต้นของโมเดลเช่นเดียวกับการจัดตำแหน่งทั่วโลก คือ
ความน่าจะเป็นจาก 0 ถึง 1 และโดยค่าเริ่มต้นจะถูกตั้งค่าเป็น 0.5 ค่าที่สูงขึ้นของ หมายความ
ที่กระทบที่เป็นเศษด้านซ้าย (N หรือ 5'-terminal) จะเป็น
ถูกลงโทษน้อยลง แต่การประสานงานทั่วโลกโดยสมบูรณ์จะถูกลงโทษมากขึ้น ต่ำกว่า
ค่าของ หมายความว่าเศษด้านซ้ายจะถูกลงโทษมากขึ้นและทั่วโลก
การจัดตำแหน่งในด้านนี้จะได้รับการสนับสนุน ตัวเลือกนี้มีผลกับ .เท่านั้น
การกำหนดค่าที่อนุญาตให้มีการจัดตำแหน่งเฉพาะ เช่น -s และ -NS; เว้นแต่อย่างใดอย่างหนึ่ง
ตัวเลือกยังเปิดใช้งาน ตัวเลือกนี้ไม่มีผล คุณมีการควบคุมที่เป็นอิสระ
เหนือพฤติกรรมการจัดตำแหน่งในพื้นที่/ทั่วโลกสำหรับปลายทาง N/C (5'/3') ของเป้าหมายของคุณ
ลำดับโดยใช้ --สเวนทรี และ --swexit.
--swexit
ควบคุมความน่าจะเป็นทั้งหมดที่กระจายไปยังการออกในพื้นที่จากแบบจำลอง
เทียบกับการสิ้นสุดการจัดตำแหน่งที่ส่วนท้ายของแบบจำลองเช่นเดียวกับการจัดตำแหน่งส่วนกลาง
คือความน่าจะเป็นตั้งแต่ 0 ถึง 1 และโดยค่าเริ่มต้นจะถูกตั้งค่าเป็น 0.5 ค่าที่สูงขึ้นของ
หมายความว่าการตีที่เป็นชิ้นส่วนทางด้านขวา (C หรือ 3'-terminal) จะเป็น
ถูกลงโทษน้อยลง แต่การประสานงานทั่วโลกโดยสมบูรณ์จะถูกลงโทษมากขึ้น ต่ำกว่า
ค่าของ หมายความว่าเศษทางด้านขวาจะถูกลงโทษมากขึ้นและทั่วโลก
การจัดตำแหน่งในด้านนี้จะได้รับการสนับสนุน ตัวเลือกนี้มีผลกับ .เท่านั้น
การกำหนดค่าที่อนุญาตให้มีการจัดตำแหน่งเฉพาะ เช่น -s และ -NS; เว้นแต่อย่างใดอย่างหนึ่ง
ตัวเลือกยังเปิดใช้งาน ตัวเลือกนี้ไม่มีผล คุณมีการควบคุมที่เป็นอิสระ
เหนือพฤติกรรมการจัดตำแหน่งในพื้นที่/ทั่วโลกสำหรับปลายทาง N/C (5'/3') ของเป้าหมายของคุณ
ลำดับโดยใช้ --สเวนทรี และ --swexit.
--รายละเอียด
พิมพ์สิ่งที่อาจเป็นประโยชน์มากขึ้น เช่น คะแนนแต่ละรายการสำหรับแต่ละซีเควนซ์
ในการจัดตำแหน่ง
--wblosum
ใช้อัลกอริธึมการกรอง BLOSUM เพื่อถ่วงน้ำหนักลำดับ แทนที่จะเป็นค่าเริ่มต้น
จัดกลุ่มลำดับตามเปอร์เซ็นต์ที่กำหนด (ดู --idlevel); มอบหมายแต่ละคน
คลัสเตอร์น้ำหนักรวม 1.0 กระจายอย่างเท่าเทียมกันในหมู่สมาชิกของ that
กลุ่ม
--wgsc ใช้อัลกอริทึมการถ่วงน้ำหนักลำดับ Gerstein/Sonnhammer/Chothia นี่คือ
เป็นค่าเริ่มต้นอยู่แล้ว ดังนั้นตัวเลือกนี้จึงไม่มีผลใดๆ (เว้นแต่จะเป็นไปตามตัวเลือกอื่น
ในตระกูล -\-w ซึ่งในกรณีนี้จะแทนที่)
--wme ใช้อัลกอริทึมเอนโทรปีสูงสุดของ Krogh/Mitchison เพื่อ "กำหนดน้ำหนัก" ของลำดับ นี้
แทนที่อัลกอริทึมการเลือกปฏิบัติสูงสุดของ Eddy/Mitchison/Durbin ซึ่งให้
ตุ้มน้ำหนักเกือบเท่ากันแต่มีความแข็งแกร่งน้อยกว่า การถ่วงน้ำหนัก ME ดูเหมือนจะให้ส่วนเพิ่ม
เพิ่มความไวเหนือน้ำหนัก GSC เริ่มต้น แต่ใช้จำนวนที่เหมาะสม
เวลา
--wone
ปิดการถ่วงน้ำหนักลำดับทั้งหมด
--wpb ใช้รูปแบบการถ่วงน้ำหนักตามตำแหน่ง Henikoff
--วอโรนอย
ใช้อัลกอริทึมการถ่วงน้ำหนักลำดับ Sibbald/Argos Voronoi แทนค่าดีฟอลต์
การชั่งน้ำหนัก GSC
ใช้ hmm2build ออนไลน์โดยใช้บริการ onworks.net