jackhmmer - ออนไลน์ในคลาวด์

นี่คือคำสั่ง jackhmmer ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้หนึ่งในเวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

โครงการ:

ชื่อ


jackhmmer - ค้นหาลำดับซ้ำกับฐานข้อมูลโปรตีน

เรื่องย่อ


แจ็คแฮมเมอร์ [ตัวเลือก]

DESCRIPTION


แจ็คแฮมเมอร์ ค้นหาแต่ละลำดับการสืบค้นซ้ำใน ต่อเป้าหมาย
ลำดับใน . การวนซ้ำครั้งแรกจะเหมือนกับ a พรอม ค้นหา. สำหรับ
การวนซ้ำครั้งถัดไป การจัดตำแหน่งแบบสอบถามหลายตำแหน่งร่วมกับลำดับเป้าหมายทั้งหมด
ความพึงพอใจ รวม เกณฑ์ ประกอบแล้ว โปรไฟล์ถูกสร้างขึ้นจากการจัดตำแหน่งนี้
(เหมือนกับการใช้ อืมสร้าง ในการจัดตำแหน่ง) และการค้นหาโปรไฟล์ของ เสร็จแล้ว
(เหมือนกับ an อืมค้นหา กับโปรไฟล์)

แบบสอบถาม อาจเป็น '-' (เครื่องหมายขีด) ซึ่งในกรณีนี้ ลำดับการสืบค้นคือ
อ่านจาก ไปป์แทนจากไฟล์ NS ไม่สามารถอ่านได้จาก
สตรีม เพราะ แจ็คแฮมเมอร์ ต้องทำหลายรอบผ่านฐานข้อมูล

รูปแบบเอาต์พุตได้รับการออกแบบมาให้มนุษย์อ่านได้ แต่มักมีมากมายจน
อ่านแล้วมันทำไม่ได้จริงและการแยกวิเคราะห์มันเป็นความเจ็บปวด NS --tblout และ --ดอมบลัด ตัวเลือก
บันทึกผลลัพธ์ในรูปแบบตารางอย่างง่ายที่กระชับและแยกวิเคราะห์ได้ง่ายขึ้น NS -o ตัวเลือก
อนุญาตให้เปลี่ยนเส้นทางเอาต์พุตหลัก รวมถึงการทิ้งใน /dev/null

OPTIONS


-h ช่วย; พิมพ์การแจ้งเตือนสั้นๆ เกี่ยวกับการใช้บรรทัดคำสั่งและตัวเลือกที่มีทั้งหมด

-N ตั้งค่าจำนวนสูงสุดของการวนซ้ำเป็น . ค่าดีฟอลต์คือ 5. ถ้า N=1 ผลลัพธ์
เทียบเท่ากับ พรอม ค้นหา.

OPTIONS การควบคุม เอาท์พุท


โดยค่าเริ่มต้น เอาต์พุตสำหรับการวนซ้ำแต่ละครั้งจะปรากฏบน stdout ในรูปแบบที่มนุษย์อ่านได้
รูปแบบแยกวิเคราะห์ค่อนข้าง ตัวเลือกเหล่านี้อนุญาตให้เปลี่ยนเส้นทางเอาต์พุตนั้นหรือบันทึก
ชนิดเพิ่มเติมของเอาต์พุตไปยังไฟล์ รวมถึงไฟล์จุดตรวจสอบสำหรับการวนซ้ำแต่ละครั้ง

-o กำหนดเอาต์พุตที่มนุษย์อ่านได้ไปยังไฟล์ .

-A หลังจากการวนซ้ำครั้งสุดท้าย ให้บันทึกการจัดตำแหน่งหลายรายการที่มีคำอธิบายประกอบของ Hit ทั้งหมด
ตรงตามเกณฑ์การรวม (รวมถึงข้อความค้นหาเดิมด้วย) ถึง in
รูปแบบสตอกโฮล์ม

--tblout
หลังจากการวนซ้ำครั้งสุดท้าย ให้บันทึกสรุปแบบตารางของรายการยอดฮิตในลำดับสูงสุดไปที่ ใน
รูปแบบแยกวิเคราะห์ได้ง่าย เรียงเป็นแนว คั่นด้วยช่องว่าง

--ดอมบลัด
หลังจากการวนซ้ำครั้งสุดท้าย ให้บันทึกสรุปตารางของโดเมนยอดนิยมที่ ใน
รูปแบบแยกวิเคราะห์ได้ง่าย เรียงเป็นแนว คั่นด้วยช่องว่าง

--chhmm
เมื่อเริ่มต้นการวนซ้ำแต่ละครั้ง ให้ตรวจสอบแบบสอบถาม HMM บันทึกลงในไฟล์ชื่อ
- .อืม ที่ไหน คือเลขวนซ้ำ (จาก 1..N)

--ชกาลี
ในตอนท้ายของการวนซ้ำแต่ละครั้ง ให้ตรวจสอบการจัดตำแหน่งโดเมนทั้งหมดที่น่าพอใจ
เกณฑ์การรวม (เช่นสิ่งที่จะกลายเป็นแบบสอบถาม HMM สำหรับการทำซ้ำครั้งต่อไป)
บันทึกลงในไฟล์ชื่อ <จุดตรวจ ไฟล์ คำนำหน้า>- .sto ในรูปแบบสตอกโฮล์ม
ที่ไหน คือเลขวนซ้ำ (จาก 1..N)

--ตาม ใช้การภาคยานุวัติแทนชื่อในเอาต์พุตหลัก หากมีให้สำหรับโปรไฟล์
และ/หรือลำดับ

--โนอาลี
ละเว้นส่วนการจัดตำแหน่งจากเอาต์พุตหลัก สิ่งนี้สามารถลดเอาต์พุตได้อย่างมาก
ปริมาณ

--notew
ไม่จำกัดความยาวของแต่ละบรรทัดในเอาต์พุตหลัก ค่าเริ่มต้นคือขีดจำกัด 120
อักขระต่อบรรทัด ซึ่งช่วยในการแสดงผลบนเทอร์มินัลและ
ในเอดิเตอร์ แต่สามารถตัดบรรทัดรายละเอียดโปรไฟล์เป้าหมายได้

--textw
ตั้งค่าขีดจำกัดความยาวบรรทัดของเอาต์พุตหลักเป็น ตัวอักษรต่อบรรทัด ค่าเริ่มต้นคือ
120.

OPTIONS การควบคุม SINGLE ลำดับ การให้คะแนน (แรก การวนซ้ำ)


โดยค่าเริ่มต้น การวนซ้ำครั้งแรกจะใช้รูปแบบการค้นหาที่สร้างจากคำค้นหาเดียว
ลำดับ. โมเดลนี้สร้างขึ้นโดยใช้เมทริกซ์ทดแทนขนาด 20x20 มาตรฐานสำหรับสารตกค้าง
ความน่าจะเป็นและสองพารามิเตอร์เพิ่มเติมสำหรับช่องว่างเปิดและช่องว่างที่ไม่ขึ้นกับตำแหน่ง
ขยายความน่าจะเป็น ตัวเลือกเหล่านี้อนุญาตให้ใช้พารามิเตอร์การให้คะแนนแบบลำดับเดียวที่เป็นค่าเริ่มต้น
ที่จะมีการเปลี่ยนแปลง

--เปิด
ตั้งค่าความน่าจะเป็นแบบเปิดช่องว่างสำหรับโมเดลคิวรีแบบลำดับเดียวเป็น . ค่าเริ่มต้น
คือ 0.02 ต้องเป็น >= 0 และ < 0.5

--ขยายความ
ตั้งค่าช่องว่างขยายความน่าจะเป็นสำหรับแบบจำลองแบบสอบถามลำดับเดียวเป็น .
ค่าเริ่มต้นคือ 0.4 ต้องเป็น >= 0 และ < 1.0

--mx
รับความน่าจะเป็นในการจัดแนวเรซิดิวจากเมทริกซ์การแทนที่ในตัวที่ชื่อ
. มีเมทริกซ์มาตรฐานหลายตัวในตัว และไม่จำเป็นต้องอ่านจาก
ไฟล์. ชื่อเมทริกซ์ สามารถเป็น PAM30, PAM70, PAM120, PAM240, BLOSUM45,
BLOSUM50, BLOSUM62, BLOSUM80 หรือ BLOSUM90 หนึ่งเดียวใน --mx และ --mxfile
อาจใช้ตัวเลือก

--mxfile
รับความน่าจะเป็นในการจัดแนวเรซิดิวจากเมทริกซ์การแทนที่ในไฟล์
. เมทริกซ์คะแนนเริ่มต้นคือ BLOSUM62 (เมทริกซ์นี้อยู่ภายใน HMMER
และไม่จำเป็นต้องเป็นไฟล์) รูปแบบของเมทริกซ์การแทนที่
เป็นรูปแบบมาตรฐานที่ BLAST, FASTA และลำดับอื่นๆ ยอมรับ
ซอฟต์แวร์วิเคราะห์

OPTIONS การควบคุม รายงาน เกณฑ์


เกณฑ์การรายงานจะควบคุมว่าจะรายงาน Hit ใดในไฟล์เอาต์พุต (เอาต์พุตหลัก
--tbloutและ --ดอมบลัด). ในแต่ละการวนซ้ำ ลำดับ Hit และโดเมน Hit จะถูกจัดลำดับ
โดยนัยสำคัญทางสถิติ (E-value) และผลลัพธ์จะถูกสร้างขึ้นในสองส่วนที่เรียกว่าต่อ
เป้าหมายและผลลัพธ์ต่อโดเมน ในเอาต์พุตต่อเป้าหมาย โดยค่าเริ่มต้น ลำดับทั้งหมดจะมีค่า an
มีการรายงานค่า E <= 10 ในผลลัพธ์ต่อโดเมน สำหรับแต่ละเป้าหมายที่ผ่านตาม
เกณฑ์การรายงานเป้าหมาย โดเมนทั้งหมดเป็นไปตามเกณฑ์การรายงานต่อโดเมน
รายงาน โดยค่าเริ่มต้น โดเมนเหล่านี้เป็นโดเมนที่มีค่า E แบบมีเงื่อนไขเท่ากับ <= 10 ต่อไปนี้
ตัวเลือกช่วยให้คุณเปลี่ยนเกณฑ์การรายงานค่า E เริ่มต้น หรือใช้คะแนนบิต
ธรณีประตูแทน

-E ลำดับรายงานด้วยค่า E <= ในการส่งออกตามลำดับ ค่าเริ่มต้นคือ 10.0

-T ใช้เกณฑ์คะแนนบิตสำหรับเอาต์พุตต่อลำดับแทนเกณฑ์ค่า E
(การตั้งค่าใดๆ ของ -E ถูกละเลย) รายงานลำดับด้วยคะแนนบิต >= . โดย
ค่าเริ่มต้น ตัวเลือกนี้ไม่ได้ตั้งค่า

-Z ประกาศขนาดรวมของฐานข้อมูลที่จะเป็น ลำดับ เพื่อวัตถุประสงค์ของ E-value
การคำนวณ โดยปกติค่า E จะถูกคำนวณโดยสัมพันธ์กับขนาดของฐานข้อมูล
คุณค้นหาจริง ๆ (เช่นจำนวนลำดับใน target_seqdb). ในบางส่วน
กรณีต่างๆ (เช่น หากคุณแบ่งฐานข้อมูลลำดับเป้าหมายออกเป็นหลายรายการ)
ไฟล์สำหรับการค้นหาของคุณแบบขนาน) คุณอาจรู้ดีกว่าขนาดที่แท้จริง
ของพื้นที่การค้นหาของคุณคือ

--โดม
รายงานโดเมนที่มีค่า E แบบมีเงื่อนไข <= ในผลลัพธ์ต่อโดเมน นอกจากนี้
สู่โดเมนที่มีคะแนนสูงสุดต่อการโจมตีในลำดับที่มีนัยสำคัญ ค่าเริ่มต้นคือ 10.0

--domT
ใช้เกณฑ์คะแนนบิตสำหรับเอาต์พุตต่อโดเมนแทนเกณฑ์ค่า E
(การตั้งค่าใดๆ ของ --domT ถูกละเลย) รายงานโดเมนที่มีคะแนนบิต >= in
ผลลัพธ์ต่อโดเมน นอกเหนือจากโดเมนที่มีคะแนนสูงสุดต่อลำดับที่มีนัยสำคัญ
ตี. โดยค่าเริ่มต้น ตัวเลือกนี้จะไม่ได้ตั้งค่า

--domZ
ประกาศจำนวนลำดับนัยสำคัญที่จะเป็น ลำดับ เพื่อวัตถุประสงค์ของ
การคำนวณค่า E แบบมีเงื่อนไขสำหรับนัยสำคัญของโดเมนเพิ่มเติม โดยทั่วไป
ค่า E แบบมีเงื่อนไขจะคำนวณโดยสัมพันธ์กับจำนวนลำดับที่ผ่าน
เกณฑ์การรายงานต่อลำดับ

OPTIONS การควบคุม รวม เกณฑ์


เกณฑ์การรวมจะควบคุม Hit ที่รวมอยู่ในการจัดตำแหน่งและโปรไฟล์หลายรายการ
สร้างขึ้นสำหรับการค้นหาซ้ำในครั้งต่อไป โดยค่าเริ่มต้น ลำดับจะต้องมีต่อ
ลำดับ E-value ของ <= 0.001 (ดู -E ตัวเลือก) ที่จะรวมและโดเมนเพิ่มเติมใด ๆ ใน
นอกจากคะแนนสูงสุดแล้วจะต้องมี E-value แบบมีเงื่อนไข <= 0.001 (ดู --โดม
ตัวเลือก). ความแตกต่างระหว่างเกณฑ์การรายงานและเกณฑ์การรวมคือ
เกณฑ์การรวมจะควบคุมว่า Hit ใดจะถูกใช้ในการทำซ้ำครั้งต่อไป (หรือ
ผลลัพธ์สุดท้ายการจัดตำแหน่งหลายตำแหน่งถ้า -A ใช้ตัวเลือก) ในขณะที่เกณฑ์การรายงาน
ควบคุมสิ่งที่คุณเห็นในผลลัพธ์ โดยทั่วไป เกณฑ์การรายงานจะหลวมกว่า ดังนั้นคุณจึงทำได้
ดูการชนแนวเขตที่ด้านบนของเสียงรบกวนที่อาจน่าสนใจ

--incE
รวมลำดับด้วยค่า E <= ในการทำซ้ำครั้งต่อไปหรือการจัดตำแหน่งขั้นสุดท้าย
เอาต์พุตโดย -A. ค่าเริ่มต้นคือ 0.001

--incT
ใช้เกณฑ์คะแนนบิตสำหรับการรวมต่อลำดับแทน E-value
เกณฑ์ (การตั้งค่าใด ๆ ของ --incE ถูกละเลย) รวมลำดับด้วยคะแนนบิตของ
>= . โดยค่าเริ่มต้น ตัวเลือกนี้จะไม่ได้ตั้งค่า

--incdomE
รวมโดเมนที่มีค่า E แบบมีเงื่อนไข <= ในการทำซ้ำครั้งต่อไปหรือขั้นสุดท้าย
เอาต์พุตการจัดตำแหน่งโดย -A, นอกเหนือจากโดเมนที่มีคะแนนสูงสุดต่อนัยสำคัญ
ตีลำดับ ค่าเริ่มต้นคือ 0.001

--incdomT
ใช้เกณฑ์คะแนนบิตสำหรับการรวมต่อโดเมนแทนเกณฑ์ค่า E
(การตั้งค่าใดๆ ของ --incT ถูกละเลย) รวมโดเมนที่มีคะแนนบิต >= . โดย
ค่าเริ่มต้น ตัวเลือกนี้ไม่ได้ตั้งค่า

OPTIONS การควบคุม เร่ง ฮิวริสติก


การค้นหา HMMER3 ถูกเร่งในไปป์ไลน์ตัวกรองสามขั้นตอน: ตัวกรอง MSV, the
ตัวกรอง Viterbi และตัวกรองไปข้างหน้า ตัวกรองแรกนั้นเร็วและมากที่สุด
โดยประมาณ; สุดท้ายคืออัลกอริธึมการให้คะแนนไปข้างหน้าแบบเต็มรูปแบบ ช้าที่สุด แต่แม่นยำที่สุด
นอกจากนี้ยังมีขั้นตอนการกรองอคติระหว่าง MSV และ Viterbi เป้าหมายที่ผ่านทุกขั้นตอน
ในไปป์ไลน์เร่งความเร็วจะถูกประมวลผลภายหลัง -- การระบุโดเมน
และให้คะแนนโดยใช้อัลกอริธึมเดินหน้า/ถอยหลัง

โดยพื้นฐานแล้ว พารามิเตอร์อิสระเพียงอย่างเดียวที่ควบคุมตัวกรองฮิวริสติกของ HMMER คือ P-
เกณฑ์ค่าควบคุมเศษส่วนที่คาดหวังของลำดับที่ไม่เท่ากันที่ผ่าน
ตัวกรอง การตั้งค่าเกณฑ์เริ่มต้นที่สูงขึ้นจะส่งผ่านสัดส่วนที่สูงขึ้นของ
ลำดับที่ไม่เท่ากันเพิ่มความไวต่อความเร็ว ตรงกันข้าม
การตั้งค่าเกณฑ์ค่า P ที่ต่ำกว่าจะส่งผ่านสัดส่วนที่น้อยลง ความไวจะลดลง
และเพิ่มความเร็ว การตั้งค่าเกณฑ์ค่า P ของตัวกรองเป็น 1.0 หมายความว่าจะผ่าน
ลำดับทั้งหมดและปิดใช้งานตัวกรองอย่างมีประสิทธิภาพ

การเปลี่ยนเกณฑ์การกรองจะลบหรือรวมเป้าหมายออกจากการพิจารณาเท่านั้น การเปลี่ยนแปลง
เกณฑ์การกรองไม่เปลี่ยนแปลงคะแนนบิต ค่า E หรือการจัดตำแหน่ง ซึ่งทั้งหมดคือ
กำหนดไว้เฉพาะในการประมวลผลภายหลัง

--สูงสุด ความไวสูงสุด ปิดตัวกรองทั้งหมด รวมทั้งตัวกรองอคติ และเรียกใช้แบบเต็ม
ไปข้างหน้า/หลังการประมวลผลภายหลังในทุกเป้าหมาย สิ่งนี้จะเพิ่มความไว
เล็กน้อยด้วยความเร็วสูง

--F1
เกณฑ์ตัวกรองแรก ตั้งค่าเกณฑ์ P-value สำหรับขั้นตอนตัวกรอง MSV NS
ค่าเริ่มต้นคือ 0.02 ซึ่งหมายความว่าประมาณ 2% ของคะแนนสูงสุด nonhomologous
เป้าหมายคาดว่าจะผ่านตัวกรอง

--F2
เกณฑ์ตัวกรองที่สอง ตั้งค่าเกณฑ์ P-value สำหรับขั้นตอนตัวกรอง Viterbi
ค่าเริ่มต้นคือ 0.001

--F3
เกณฑ์ตัวกรองที่สาม ตั้งค่าเกณฑ์ P-value สำหรับขั้นตอนตัวกรองไปข้างหน้า NS
ค่าเริ่มต้นคือ 1e-5

--โนเบีย
ปิดตัวกรองอคติ สิ่งนี้จะเพิ่มความไวเล็กน้อย แต่สามารถมาที่a
ความเร็วสูงโดยเฉพาะอย่างยิ่งถ้าแบบสอบถามมีองค์ประกอบตกค้างลำเอียง (เช่น
บริเวณที่มีลำดับซ้ำๆ หรือถ้าเป็นโปรตีนเมมเบรนที่มีบริเวณขนาดใหญ่ของ
ไม่ชอบน้ำ) หากไม่มีตัวกรองอคติ ลำดับมากเกินไปอาจผ่านตัวกรอง
ด้วยข้อความค้นหาที่ลำเอียง ส่งผลให้ประสิทธิภาพการทำงานช้ากว่าที่คาดไว้เนื่องจาก
อัลกอริธึม Forward/Backward แบบเข้มข้นเชิงคำนวณรองรับการทำงานหนักอย่างผิดปกติ
ภาระ

OPTIONS การควบคุม ข้อมูลส่วนตัว การก่อสร้าง (ภายหลัง การวนซ้ำ)


ตัวเลือกเหล่านี้ควบคุมวิธีการกำหนดคอลัมน์ฉันทามติในการจัดตำแหน่งหลายตำแหน่งเมื่อ
โปรไฟล์อาคาร โดยค่าเริ่มต้น, แจ็คแฮมเมอร์ รวมลำดับการสืบค้นเดิมของคุณใน
ผลการจัดตำแหน่งในทุก ๆ การวนซ้ำ และตำแหน่งฉันทามติถูกกำหนดโดยแบบสอบถามนั้น
ลำดับ: นั่นคือ ค่าเริ่มต้น แจ็คแฮมเมอร์ โปรไฟล์จะมีความยาวเท่ากับต้นฉบับของคุณเสมอ
สอบถามทุกครั้งที่ทำซ้ำ

--เร็ว กำหนดคอลัมน์ฉันทามติเป็นคอลัมน์ที่มีเศษส่วน >= ซิมแฟรค ของสารตกค้างเช่น
ตรงข้ามกับช่องว่าง (ดูด้านล่างสำหรับ --ซิมแฟรก ตัวเลือก) แม้ว่านี่จะเป็นค่าเริ่มต้น
ตัวเลือกการสร้างโปรไฟล์ที่อื่น (in อืมสร้างโดยเฉพาะอย่างยิ่ง) ก็อาจจะมี
ผลกระทบที่ไม่พึงประสงค์ใน แจ็คแฮมเมอร์เพราะโปรไฟล์สามารถวนซ้ำไปมาได้
เรียงลำดับพื้นที่ให้ห่างจากข้อความค้นหาเดิมของคุณ โดยปล่อยให้คอลัมน์ฉันทามติไม่กี่คอลัมน์หรือไม่มีเลย
สอดคล้องกับสารตกค้าง

--มือ กำหนดคอลัมน์ฉันทามติในโปรไฟล์ถัดไปโดยใช้คำอธิบายประกอบอ้างอิงถึงหลายรายการ
การจัดตำแหน่ง แจ็คแฮมเมอร์ เผยแพร่คำอธิบายประกอบอ้างอิงจากโปรไฟล์ก่อนหน้าไปยัง
การจัดตำแหน่งหลายตำแหน่งและจากนั้นไปยังโปรไฟล์ถัดไป นี่คือค่าเริ่มต้น

--ซิมแฟรก
กำหนดเกณฑ์เศษส่วนตกค้างที่จำเป็นในการกำหนดคอลัมน์ฉันทามติเมื่อ
โดยใช้โปรแกรม --เร็ว ตัวเลือก. ค่าเริ่มต้นคือ 0.5 เศษส่วนสัญลักษณ์ในแต่ละคอลัมน์คือ
คำนวณหลังจากพิจารณาการถ่วงน้ำหนักลำดับสัมพัทธ์และละเว้นช่องว่าง
อักขระที่สอดคล้องกับส่วนท้ายของชิ้นส่วนลำดับ (ตรงข้ามกับภายใน
การแทรก/การลบ) การตั้งค่านี้เป็น 0.0 หมายความว่าทุกคอลัมน์การจัดตำแหน่งจะ
ได้รับมอบหมายให้เป็นฉันทามติซึ่งอาจเป็นประโยชน์ในบางกรณี กำลังตั้งค่าเป็น 1.0
หมายความว่าเฉพาะคอลัมน์ที่มี 0 ช่องว่าง (การแทรก/การลบภายใน) จะเป็น
ได้รับมอบหมายให้เป็นเอกฉันท์

--แฟรกเธรช
เราเพียงต้องการนับช่องว่างเทอร์มินัลเป็นการลบหากทราบลำดับที่จัดตำแหน่ง
ให้เต็มความยาวไม่ใช่เศษส่วน (เช่น เพราะเพียงบางส่วนเท่านั้น
ถูกจัดลำดับ) HMMER ใช้กฎง่ายๆ ในการอนุมานเศษส่วน: ถ้าลำดับความยาว
L น้อยกว่าหรือเท่ากับเศษส่วน คูณความยาวของการจัดตำแหน่งในคอลัมน์
จากนั้นลำดับจะถูกจัดการเป็นส่วนย่อย ค่าเริ่มต้นคือ 0.5 การตั้งค่า
--แฟรกเธรช0 จะกำหนดลำดับ (ไม่ว่าง) เป็นส่วนย่อย; คุณอาจต้องการ
ทำเช่นนี้ถ้าคุณรู้ว่าคุณมีการจัดตำแหน่งเต็มความยาวอย่างระมัดระวัง
ลำดับ การตั้งค่า --แฟรกเธรช1 จะกำหนดลำดับทั้งหมดเป็นส่วนย่อย คุณอาจ
ต้องการทำเช่นนี้ถ้าคุณรู้ว่าการจัดตำแหน่งของคุณประกอบด้วยชิ้นส่วนทั้งหมดเช่น
ตามที่แปลอ่านสั้น ๆ ในข้อมูลปืนลูกซอง metagenomic

OPTIONS การควบคุม ญาติ น้ำหนัก


เมื่อใดก็ตามที่โปรไฟล์ถูกสร้างขึ้นจากการจัดตำแหน่งหลายตำแหน่ง HMMER จะใช้ลำดับเฉพาะกิจ
อัลกอริทึมการถ่วงน้ำหนักเพื่อลดน้ำหนักลำดับที่เกี่ยวข้องอย่างใกล้ชิดและน้ำหนักเกินที่เกี่ยวข้องกัน
คน สิ่งนี้มีผลในการทำให้แบบจำลองมีอคติน้อยลงโดยสายวิวัฒนาการที่ไม่สม่ำเสมอ
การเป็นตัวแทน ตัวอย่างเช่น ลำดับที่เหมือนกันสองลำดับโดยปกติแต่ละลำดับจะได้รับครึ่ง
น้ำหนักที่หนึ่งซีเควนซ์จะ (และนี่คือเหตุผล แจ็คแฮมเมอร์ ไม่ห่วงเสมอ
รวมถึงลำดับการสืบค้นเดิมของคุณในการจัดตำแหน่งการวนซ้ำแต่ละครั้ง แม้ว่าจะพบก็ตาม
อีกครั้งในฐานข้อมูลที่คุณกำลังค้นหา) ตัวเลือกเหล่านี้ควบคุมว่าจะใช้อัลกอริทึมใด

--wpb ใช้โครงร่างการถ่วงน้ำหนักตามลำดับตามตำแหน่ง Henikoff [Henikoff และ Henikoff
เจ โมล. ไบโอล. 243:574, 1994]. นี่คือค่าเริ่มต้น

--wgsc ใช้อัลกอริทึมการถ่วงน้ำหนัก Gerstein/Sonnhammer/Chothia [Gerstein et al, J. Mol
ไบโอล. 235:1067, 1994].

--wblosum
ใช้รูปแบบการจัดกลุ่มแบบเดียวกับที่ใช้ในการชั่งน้ำหนักข้อมูลในการคำนวณ BLOSUM
เมทริกซ์แทนค่า [Henikoff and Henikoff, Proc. นัท อคาเด วิทย์ 89:10915, 1992].
ลำดับเป็นการรวมกลุ่มลิงก์เดียวที่เกณฑ์ข้อมูลประจำตัว (ค่าเริ่มต้น 0.62; ดู
--วิด) และภายในแต่ละคลัสเตอร์ของลำดับ c แต่ละลำดับจะได้รับน้ำหนักสัมพัทธ์
1/ค.

--wone
ไม่มีน้ำหนักสัมพัทธ์ ลำดับทั้งหมดถูกกำหนดน้ำหนักที่สม่ำเสมอ

--วิด
ตั้งค่าขีดจำกัดข้อมูลประจำตัวที่ใช้โดยการทำคลัสเตอร์ลิงก์เดียวเมื่อใช้ --wblosum.
ใช้กับแผนการถ่วงน้ำหนักอื่นๆ ไม่ได้ ค่าเริ่มต้นคือ 0.62

OPTIONS การควบคุม ที่มีประสิทธิภาพ ลำดับ จำนวน


หลังจากกำหนดน้ำหนักสัมพัทธ์แล้ว จะถูกทำให้เป็นมาตรฐานเพื่อรวมเป็นประสิทธิผลทั้งหมด
ลำดับหมายเลข, eff_nseq. ตัวเลขนี้อาจเป็นจำนวนจริงของลำดับใน
การจัดตำแหน่ง แต่ก็มักจะเล็กกว่านั้นเกือบทุกครั้ง การถ่วงน้ำหนักเอนโทรปีเริ่มต้น
วิธี (-เอนท์) ลดหมายเลขลำดับที่มีประสิทธิภาพเพื่อลดเนื้อหาข้อมูล
(เอนโทรปีสัมพัทธ์หรือคะแนนเฉลี่ยที่คาดหวังจาก homologs ที่แท้จริง) ต่อตำแหน่งที่เป็นเอกฉันท์ NS
เอนโทรปีสัมพัทธ์เป้าหมายถูกควบคุมโดยฟังก์ชันสองพารามิเตอร์ โดยที่ two
พารามิเตอร์สามารถตั้งค่าได้ด้วย --เออ และ --esigma.

--ent ปรับหมายเลขลำดับที่มีประสิทธิภาพเพื่อให้ได้เอนโทรปีสัมพัทธ์เฉพาะต่อ
ตำแหน่ง (ดู --เออ). นี่คือค่าเริ่มต้น

--อีคลัสเตอร์
ตั้งค่าหมายเลขลำดับที่มีประสิทธิผลเป็นจำนวนคลัสเตอร์ที่มีการเชื่อมโยงเดี่ยวที่a
เกณฑ์เอกลักษณ์เฉพาะ (ดู --ทางหลวง). ไม่แนะนำให้ใช้ตัวเลือกนี้ มันสำหรับ
การทดลองประเมินว่าดีขึ้นแค่ไหน --ent เป็น

--เอโนเน
ปิดการกำหนดหมายเลขลำดับที่มีประสิทธิภาพ และใช้จำนวนจริงของ
ลำดับ เหตุผลหนึ่งที่คุณอาจต้องการทำคือพยายามเพิ่มค่าสัมพัทธ์ให้มากที่สุด
เอนโทรปี/ตำแหน่งของแบบจำลองของคุณ ซึ่งอาจเป็นประโยชน์สำหรับแบบจำลองขนาดสั้น

--eset
กำหนดหมายเลขลำดับที่มีประสิทธิภาพสำหรับทุกรุ่นอย่างชัดเจนเป็น .

--เออ
ตั้งค่าเอนโทรปีสัมพัทธ์ขั้นต่ำ/เป้าหมายตำแหน่งเป็น . ต้องใช้ --ent. ค่าเริ่มต้น
ขึ้นอยู่กับลำดับตัวอักษร; สำหรับลำดับโปรตีน คือ 0.59 บิต/ตำแหน่ง

--esigma
ตั้งค่าเอนโทรปีสัมพัทธ์ขั้นต่ำที่สนับสนุนโดยการจัดตำแหน่งแบบจำลองทั้งหมด over
ความยาวทั้งหมดของมัน มีผลทำให้โมเดลสั้นมีความสัมพัทธ์สูงกว่า
เอนโทรปีต่อตำแหน่งthan --เออ คนเดียวจะให้ ค่าเริ่มต้นคือ 45.0 บิต

--ทางหลวง
ตั้งค่าคัทออฟเอกลักษณ์คู่แบบเศษส่วนที่ใช้โดยการทำคลัสเตอร์ลิงก์เดียวด้วย
--อีคลัสเตอร์ ตัวเลือก. ค่าเริ่มต้นคือ 0.62

OPTIONS การควบคุม ก่อนหน้า


ในการสร้างโปรไฟล์ ตามค่าเริ่มต้น จำนวนที่ถ่วงน้ำหนักจะถูกแปลงเป็นค่าเฉลี่ยหลัง
การประมาณค่าพารามิเตอร์ความน่าจะเป็นโดยใช้สารผสม Dirichlet Priors ส่วนผสมเริ่มต้น Dirichlet
พารามิเตอร์ก่อนหน้าสำหรับแบบจำลองโปรตีนและสำหรับแบบจำลองกรดนิวคลีอิก (RNA และ DNA) ถูกสร้างขึ้น
ใน ตัวเลือกต่อไปนี้อนุญาตให้คุณลบล้างค่านิยมเริ่มต้น

--พโนเน่ ไม่ใช้พรีเวดดิ้งใดๆ พารามิเตอร์ความน่าจะเป็นจะเป็นเพียงการสังเกตเท่านั้น
ความถี่หลังจากการถ่วงน้ำหนักลำดับสัมพัทธ์

--สถานที่ ใช้ Laplace +1 ก่อนแทนที่ส่วนผสมเริ่มต้นของ Dirichlet ก่อน

OPTIONS การควบคุม E-VALUE สอบเทียบ


การประมาณค่าพารามิเตอร์สถานที่สำหรับการกระจายคะแนนที่คาดไว้สำหรับตัวกรอง MSV
คะแนน คะแนนกรอง Viterbi และคะแนนไปข้างหน้าต้องใช้ลำดับสุ่มสั้น ๆ สามลำดับ
การจำลอง

--เอ็มแอล
ตั้งค่าความยาวของลำดับในการจำลองที่ประเมินพารามิเตอร์ตำแหน่ง mu for
ค่า E ของตัวกรอง MSV ค่าเริ่มต้นคือ 200

--เอมเอ็น
ตั้งค่าจำนวนลำดับในการจำลองที่ประเมินพารามิเตอร์ตำแหน่ง mu
สำหรับค่า E ของตัวกรอง MSV ค่าเริ่มต้นคือ 200

--EvL
ตั้งค่าความยาวของลำดับในการจำลองที่ประเมินพารามิเตอร์ตำแหน่ง mu for
Viterbi กรองค่า E ค่าเริ่มต้นคือ 200

--EvN
ตั้งค่าจำนวนลำดับในการจำลองที่ประเมินพารามิเตอร์ตำแหน่ง mu
สำหรับค่า E ของตัวกรอง Viterbi ค่าเริ่มต้นคือ 200

--EfL
ตั้งค่าความยาวของลำดับในการจำลองที่ประเมินพารามิเตอร์ตำแหน่ง tau
สำหรับ Forward E-values ค่าเริ่มต้นคือ 100

--เอิฟเอ็น
ตั้งค่าจำนวนลำดับในการจำลองที่ประเมินพารามิเตอร์ตำแหน่ง
tau สำหรับ Forward E-values ค่าเริ่มต้นคือ 200

--Eft
ตั้งค่าเศษส่วนมวลส่วนท้ายให้พอดีกับการจำลองที่ประเมินตำแหน่ง
พารามิเตอร์ tau สำหรับการส่งต่อค่า ค่าเริ่มต้นคือ 0.04

อื่น ๆ OPTIONS


--ไม่มีค่าว่าง2
ปิดการแก้ไขคะแนน null2 สำหรับองค์ประกอบที่ลำเอียง

-Z ยืนยันว่าจำนวนเป้าหมายทั้งหมดในการค้นหาของคุณคือ , เพื่อวัตถุประสงค์
ของการคำนวณค่า E ตามลำดับ แทนที่จะเป็นจำนวนเป้าหมายจริง
เห็น.

--domZ
ยืนยันว่าจำนวนเป้าหมายทั้งหมดในการค้นหาของคุณคือ , เพื่อวัตถุประสงค์
ของการคำนวณค่า E แบบมีเงื่อนไขต่อโดเมน แทนที่จะเป็นจำนวนเป้าหมาย
ที่ผ่านเกณฑ์การรายงาน

--เมล็ด
เมล็ดพันธุ์เครื่องกำเนิดตัวเลขสุ่มด้วย , จำนวนเต็ม >= 0. If คือ >0, ใดๆ
การจำลองสุ่มจะทำซ้ำได้ คำสั่งเดียวกันจะให้เหมือนกัน
ผลลัพธ์. ถ้า คือ 0 ตัวสร้างตัวเลขสุ่มจะถูกเพาะโดยพลการและ
การจำลองแบบสุ่มจะแตกต่างกันไปตามการเรียกใช้คำสั่งเดียวกัน ค่าเริ่มต้น
เมล็ดคือ 42

--qรูปแบบ
ประกาศว่าอินพุต query_seqfile อยู่ในรูปแบบ . ไฟล์ลำดับที่ยอมรับ
รูปแบบต่างๆ ได้แก่ FASTA, EMBL, GenBank, DDBJ, UniProt, Stockholm และ SELEX ค่าเริ่มต้น
คือการตรวจหารูปแบบของไฟล์โดยอัตโนมัติ

--รูปแบบ
ประกาศว่าอินพุต target_seqdb อยู่ในรูปแบบ . ไฟล์ลำดับที่ยอมรับ
รูปแบบต่างๆ ได้แก่ FASTA, EMBL, GenBank, DDBJ, UniProt, Stockholm และ SELEX ค่าเริ่มต้น
คือการตรวจหารูปแบบของไฟล์โดยอัตโนมัติ

--ซีพียู
ตั้งค่าจำนวนเธรดของผู้ปฏิบัติงานแบบขนานเป็น . ตามค่าเริ่มต้น HMMER จะตั้งค่านี้เป็น
จำนวนคอร์ CPU ที่ตรวจพบในเครื่องของคุณ นั่นคือพยายามขยายให้ใหญ่สุด
การใช้คอร์โปรเซสเซอร์ที่มีอยู่ของคุณ การตั้งค่า สูงกว่าจำนวน
คอร์ที่มีอยู่นั้นมีค่าเพียงเล็กน้อย แต่คุณอาจต้องการตั้งค่าเป็นบางอย่าง
น้อย. คุณยังสามารถควบคุมตัวเลขนี้ได้โดยการตั้งค่าตัวแปรสภาพแวดล้อม
HMMER_NCPU.

ตัวเลือกนี้จะใช้ได้ก็ต่อเมื่อ HMMER ถูกคอมไพล์ด้วยการสนับสนุนเธรด POSIX
นี่เป็นค่าเริ่มต้น แต่อาจถูกปิดในขณะรวบรวมสำหรับไซต์ของคุณ
หรือเครื่องด้วยเหตุผลบางอย่าง

--แผงลอย
สำหรับการดีบักเวอร์ชันต้นแบบ/ผู้ปฏิบัติงานของ MPI: หยุดชั่วคราวหลังจากเริ่มต้น เพื่อเปิดใช้งาน
นักพัฒนาเพื่อแนบดีบักเกอร์กับมาสเตอร์และกระบวนการของผู้ปฏิบัติงาน ส่ง
SIGCONT สัญญาณเพื่อปล่อยการหยุดชั่วคราว (ภายใต้ gdb: (gdb) สัญญาณ ซิกคอน) (เท่านั้น
ใช้ได้หากเปิดใช้งานการรองรับ MPI เสริมในเวลาคอมไพล์)

--mpi เรียกใช้ในโหมดต้นแบบ/ผู้ปฏิบัติงานของ MPI โดยใช้ มปีรัน. (ใช้ได้เฉพาะในกรณีที่ MPI . เป็นทางเลือก
เปิดใช้งานการสนับสนุนในเวลาคอมไพล์)

ใช้ jackhmmer ออนไลน์โดยใช้บริการ onworks.net



โปรแกรมออนไลน์ Linux และ Windows ล่าสุด