ธีสิส - ออนไลน์ในคลาวด์

นี่คือคำสั่ง theseus ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

โครงการ:

ชื่อ


ธีซีอุส - ความเป็นไปได้สูงสุด ซ้อนทับพร้อมกันหลายรายการพร้อมสถิติ
การวิเคราะห์

เรื่องย่อ


ธีซีอุส [ตัวเลือก] pdbfile1 [pdbfile2 ... ]

และ

เธเซอุส_ไลน์ [ตัวเลือก] -f pdbfile1 [pdbfile2 ... ]

DESCRIPTION


เธเซอุส ทับซ้อนชุดของโครงสร้างโมเลกุลขนาดใหญ่พร้อมกันโดยใช้วิธีการของ
ความเป็นไปได้สูงสุด (ML) มากกว่าเกณฑ์กำลังสองน้อยที่สุดแบบธรรมดา เธเซอุส
ถือว่าโครงสร้างมีการกระจายตามเมทริกซ์การแจกแจงแบบเกาส์เซียน
และค่าลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วมของอะตอมมีการกระจายแบบลำดับชั้น
ตามการกระจายแกมมาผกผัน โมเดลการวางซ้อน ML นี้สร้างได้มาก
ผลลัพธ์ที่แม่นยำยิ่งขึ้นโดยการลดขนาดพื้นที่ตัวแปรของโครงสร้างและ
โดยการแก้ไขความสัมพันธ์ระหว่างอะตอม

เธเซอุส ดำเนินการในสองโหมดหลัก: (1) โหมดสำหรับการวางโครงสร้างที่เหมือนกัน
ลำดับและ (2) โหมดสำหรับโครงสร้างที่มีลำดับต่างกัน แต่มีโครงสร้างที่คล้ายคลึงกัน:

(1) โหมดสำหรับการซ้อนโมเลกุลขนาดใหญ่ที่มีลำดับและตัวเลขเหมือนกัน
ของสารตกค้าง เช่น แบบจำลองหลายตัวในตระกูล NMR หรือโครงสร้างหลายตัว
จากรูปแบบผลึกที่แตกต่างกันของโปรตีนชนิดเดียวกัน

ในโหมดนี้ เธเซอุส จะอ่านทุกรุ่นในทุกไฟล์บนบรรทัดคำสั่งและ
แทนที่พวกเขา

ตัวอย่าง:

ธีซีอุส 1s40.pdb

ในตัวอย่างข้างต้น 1s40.pdb เป็นไฟล์ pdb ของโมเดล 10 NMR

(2) โหมด ``การจัดตำแหน่ง'' สำหรับการซ้อนโครงสร้างที่มีลำดับต่างกัน
ตัวอย่างเช่น โครงสร้างหลายโครงสร้างของโปรตีน cytochrome c จากสปีชีส์ต่างกัน
หรือโครงสร้างกลายพันธุ์หลายอย่างของไลโซไซม์ไข่ไก่ขาว

โหมดนี้ต้องการให้ผู้ใช้ระบุไฟล์การจัดลำดับของโครงสร้าง
ถูกซ้อนทับ (ดูตัวเลือก -A และ ``รูปแบบไฟล์'' ด้านล่าง) นอกจากนี้มัน
อาจจำเป็นต้องจัดหาไฟล์แผนที่ที่บอก ธีซีอุส ไฟล์โครงสร้าง PDB ใด
สอดคล้องกับลำดับในการจัดตำแหน่ง (ดูตัวเลือก -M และ ``รูปแบบไฟล์''
ด้านล่าง). mapfile ไม่จำเป็นถ้าชื่อลำดับและ pdb . ที่สอดคล้องกัน
ชื่อไฟล์เหมือนกัน ในโหมดนี้ หากมีแบบจำลองโครงสร้างหลายแบบใน
ไฟล์ PDB ธีซีอุส อ่านเฉพาะรุ่นแรกในแต่ละไฟล์บนบรรทัดคำสั่ง ใน
คำอื่น ๆ, ธีซีอุส ปฏิบัติต่อไฟล์บนบรรทัดคำสั่งเสมือนว่ามีเพียงไฟล์เดียว
โครงสร้างต่อไฟล์

1 ตัวอย่าง:

ธีซีอุส -A cytc.aln -M cytc.filemap d1cih__.pdb d1csu__.pdb d1kyow_.pdb

ในตัวอย่างข้างต้น d1cih__.pdb, d1csu__.pdb และ d1kyow_.pdb เป็นไฟล์ pdb ของ
โดเมน cytochrome c จากฐานข้อมูล SCOP

2 ตัวอย่าง:

เธเซอุส_ไลน์ -f d1cih__.pdb d1csu__.pdb d1kyow_.pdb

ในตัวอย่างนี้ เธเซอุส_ไลน์ สคริปต์ถูกเรียกให้ทำงานหนักเพื่อคุณ
มันจะคำนวณการจัดตำแหน่งลำดับแล้วแทนที่ตามการจัดตำแหน่งนั้น
บท เธเซอุส_ไลน์ ใช้ตัวเลือกเดียวกับ ธีซีอุส โปรแกรม. หมายเหตุ
ต้องแก้ไขสองสามบรรทัดแรกของสคริปต์นี้สำหรับระบบของคุณ เนื่องจากมันเรียก an
โปรแกรมการจัดตำแหน่งหลายลำดับภายนอกเพื่อทำการจัดตำแหน่ง ดู
ตัวอย่าง / ไดเร็กทอรีสำหรับรายละเอียดเพิ่มเติม รวมถึงไฟล์ตัวอย่าง

OPTIONS


อัลกอริทึม ตัวเลือก ค่าเริ่มต้น in {วงเล็บ}:
--อำพัน
ทำการประมวลผลพิเศษสำหรับไฟล์ PDB ที่จัดรูปแบบ AMBER8

คนส่วนใหญ่ไม่จำเป็นต้องใช้ตัวเลือกแบบยาวนี้ เว้นแต่ว่าคุณกำลังประมวลผล MD
ร่องรอยจากอำพัน AMBER ใส่ชื่ออะตอมในคอลัมน์ที่ไม่ถูกต้องในไฟล์ PDB

-a [การเลือก]
อะตอมที่จะรวมในการทับซ้อน ตัวเลือกนี้ใช้อาร์กิวเมนต์สองประเภท
(1) ตัวเลขที่ระบุชุดของประเภทอะตอมที่เลือกไว้ล่วงหน้า หรือ (2) คำอธิบายที่ชัดเจน
รายการอะตอมที่คั่นด้วยเครื่องหมายทวิภาคในรูปแบบ PDB

สำหรับชุดย่อยของประเภทอะตอมที่เลือกไว้ล่วงหน้า จะมีตัวเลือกจำนวนเต็มต่อไปนี้:

· 0, อัลฟาคาร์บอนสำหรับโปรตีน, C1´ อะตอมสำหรับกรดนิวคลีอิก
· 1 กระดูกสันหลัง
· 2 ทั้งหมด
· 3 อัลฟ่าและเบตาคาร์บอน
· 4 อะตอมหนักทั้งหมด (ไม่มีไฮโดรเจน)

หมายเหตุ เฉพาะ .A0 มีตัวเลือกเมื่อวางโครงสร้างทับด้วย
ลำดับที่แตกต่างกัน

หากต้องการกำหนดเองให้เลือกชุดอะตอมที่ชัดเจน ต้องระบุประเภทอะตอม
ตรงตามที่ระบุในฟิลด์ไฟล์ PDB รวมถึงช่องว่างและประเภทอะตอมต้อง
ห่อหุ้มด้วยเครื่องหมายคำพูด อะตอมหลายชนิดต้องคั่นด้วยเครื่องหมายทวิภาค
ตัวอย่างเช่น

-a ` N : CA : C : O '

จะระบุชนิดของอะตอมในกระดูกสันหลังของเปปไทด์

-f อ่านเฉพาะรุ่นแรกของไฟล์ PDB แบบหลายรุ่น

-h ช่วยเหลือ/การใช้งาน

-i [มมมม]
การวนซ้ำสูงสุด {200}

-p [ความแม่นยำ]
ขอความแม่นยำสัมพัทธ์สำหรับการบรรจบกัน {1e-7}

-r [ราก พร้อมชื่อ]
ชื่อรูทที่จะใช้ในการตั้งชื่อไฟล์เอาต์พุต {theseus}

-s [นน:...]
การเลือกสิ่งตกค้าง (เช่น -s15-45:50-55), {ทั้งหมด}

-S [นน:...]
สารตกค้างที่จะไม่รวม (เช่น -S15-45:50-55) {ไม่มี}

สองตัวเลือกก่อนหน้ามีรูปแบบเดียวกัน สารตกค้าง (หรือคอลัมน์การจัดตำแหน่ง) ช่วง
ถูกระบุโดยจุดเริ่มต้นและจุดสิ้นสุดคั่นด้วยเส้นประ หลายช่วงในใดๆ
ลำดับโดยพลการคั่นด้วยเครื่องหมายทวิภาค โซ่สามารถเลือกได้โดยการให้
chain ID ทันทีก่อนช่วงตกค้าง ตัวอย่างเช่น, -sA1-20:A40-71
จะรวมเฉพาะสารตกค้าง 1 ถึง 20 และ 40 ถึง 70 ในสายโซ่ A เท่านั้น โซ่ไม่สามารถ
กำหนดไว้เมื่อซ้อนโครงสร้างที่มีลำดับต่างกัน

-v ใช้การถ่วงน้ำหนักความแปรปรวน ML (ไม่มีความสัมพันธ์) {ค่าเริ่มต้น}

อินพุต / เอาต์พุต ตัวเลือก:
-A [ลำดับ การวางแนว ไฟล์]
ไฟล์การจัดลำดับเพื่อใช้เป็นแนวทาง (รูปแบบ CLUSTAL หรือ A2M)

สำหรับใช้เมื่อซ้อนทับโครงสร้างที่มีลำดับต่างกัน ดู ``รูปแบบไฟล์''
ด้านล่าง

-E พิมพ์ตัวเลือกผู้เชี่ยวชาญ

-F พิมพ์ไฟล์ FASTA ของลำดับในไฟล์ PDB และออกจาก

ตัวเลือกที่มีประโยชน์เมื่อซ้อนโครงสร้างที่มีลำดับต่างกัน ไฟล์
เอาต์พุตที่มีตัวเลือกนี้สามารถจัดชิดกับโปรแกรมการจัดตำแหน่งแบบหลายลำดับได้
เช่น CLUSTAL หรือ MUSCLE และไฟล์การจัดตำแหน่งผลลัพธ์ที่ใช้เป็น ธีซีอุส
ป้อนข้อมูลด้วย -A ตัวเลือก

-h ช่วยเหลือ/การใช้งาน

-I เพียงคำนวณสถิติสำหรับไฟล์อินพุต อย่าทับถม

-M [ไฟล์แผนที่]
ไฟล์ที่แมปไฟล์ PDB กับลำดับในการจัดตำแหน่ง

ไฟล์รูปแบบสองคอลัมน์อย่างง่าย ดู ``รูปแบบไฟล์'' ด้านล่าง ใช้กับโหมด 2

-n อย่าเขียนไฟล์ pdb ที่แปลงแล้ว

-o [การอ้างอิง โครงสร้าง]
ไฟล์อ้างอิงเพื่อวางทับ การหมุนทั้งหมดสัมพันธ์กับรุ่นแรกใน
ไฟล์นี้

ตัวอย่างเช่น 'theseus -o cytc1.pdb cytc1.pdb cytc2.pdb cytc3.pdb' จะแทนที่
โครงสร้างและหมุนการทับซ้อนสุดท้ายทั้งหมดเพื่อให้โครงสร้างจาก
cytc1.pdb อยู่ในแนวเดียวกันกับโครงสร้างใน cytc1.pdb PDB ดั้งเดิม
ไฟล์

-V เวอร์ชั่น

หลัก ส่วนประกอบ การวิเคราะห์:
-C ใช้เมทริกซ์ความแปรปรวนร่วมสำหรับ PCA (เมทริกซ์สหสัมพันธ์เป็นค่าเริ่มต้น)

-P [มมมม]
จำนวนองค์ประกอบหลักในการคำนวณ {0}

ในทั้งสองข้อข้างต้น องค์ประกอบหลักที่สอดคล้องกันจะถูกเขียนใน B-
ฟิลด์แฟคเตอร์ของไฟล์เอาต์พุต PDB โดยปกติจะมีเพียงพีซีสองสามเครื่องแรกเท่านั้นที่มี
ดอกเบี้ย (อาจถึงหก)

ตัวอย่าง ธีซีอุส 2sdf.pdb

ธีซีอุส -l -r new2sdf 2sdf.pdb

ธีซีอุส -s15-45 -P3 2sdf.pdb

ธีซีอุส -A cytc.aln -M Cytc.mapfile -o cytc1.pdb -s1-40 cytc1.pdb cytc2.pdb cytc3.pdb
cytc4.pdb

และพวกเรา


คุณสามารถตั้งค่าตัวแปรสภาพแวดล้อม 'PDBDIR' เป็นไดเร็กทอรีไฟล์ PDB ของคุณและ ธีซีอุส จะ
ดูที่นั่นหลังจากไดเร็กทอรีการทำงานปัจจุบัน ตัวอย่างเช่น ใน C เชลล์ (tcsh or
csh) คุณสามารถใส่สิ่งที่คล้ายกับสิ่งนี้ในไฟล์ .cshrc ของคุณ:

setenv PDBDIR '/usr/share/pdbs/'

ไฟล์ รูปแบบ


เธเซอุส จะอ่านไฟล์รูปแบบ PDB มาตรฐาน (ดูhttp://www.rcsb.org/pdb/>). ทั้งหมด
มีความพยายามเพื่อให้โปรแกรมยอมรับรูปแบบไฟล์ CNS และ X-PLOR ที่ไม่เป็นมาตรฐาน
ด้วย

ไฟล์อื่น ๆ อีกสองไฟล์ที่สมควรกล่าวถึง ได้แก่ ไฟล์การจัดตำแหน่งลำดับและไฟล์แผนที่

ลำดับ การวางแนว ไฟล์
เมื่อซ้อนโครงสร้างที่มีอัตลักษณ์ตกค้างต่างกัน (โดยที่ความยาวของแต่ละ
โมเลกุลขนาดใหญ่ในแง่ของสารตกค้างไม่จำเป็นต้องเท่ากัน) การจัดตำแหน่งลำดับ
ต้องรวมไฟล์สำหรับ ธีซีอุส เพื่อใช้เป็นแนวทาง (ระบุโดย -A ตัวเลือก) เธเซอุส
ยอมรับทั้ง CLUSTAL และ A2M (FASTA) ที่จัดรูปแบบไฟล์การจัดตำแหน่งหลายลำดับ

หมายเหตุ 1: ลำดับของสารตกค้างในการจัดตำแหน่งต้องตรงกับลำดับของสารตกค้าง
กำหนดไว้ในพิกัดของไฟล์ PDB นั่นคือไม่มีขาดหายไปหรือพิเศษ
เรซิดิวที่ไม่สอดคล้องกับลำดับในไฟล์ PDB วิธีง่ายๆ ที่มั่นใจได้
ว่าลำดับของคุณตรงกับไฟล์ PDB คือการสร้างลำดับโดยใช้
ธีซีอุส' -F ตัวเลือกซึ่งเขียนไฟล์ลำดับที่จัดรูปแบบ FASTA ของสายโซ่ใน
ไฟล์ PDB ไฟล์ที่ส่งออกด้วยตัวเลือกนี้สามารถจัดชิดกับ multiple
โปรแกรมการจัดตำแหน่งลำดับ เช่น CLUSTAL หรือ MUSCLE และผลลัพธ์การจัดตำแหน่งผลลัพธ์
ไฟล์ที่ใช้เป็น ธีซีอุส ป้อนข้อมูลด้วย -A ตัวเลือก

หมายเหตุ 2: ไฟล์ PDB ทุกไฟล์ต้องมีลำดับที่สอดคล้องกันในการจัดตำแหน่ง อย่างไรก็ตาม ไม่
ทุกลำดับในการจัดตำแหน่งต้องมีไฟล์ PDB ที่สอดคล้องกัน นั่นคือสามารถ
เป็นลำดับพิเศษในการจัดตำแหน่งที่ไม่ได้ใช้เพื่อชี้นำการซ้อนทับ

PDB -> ลำดับ ไฟล์แผนที่
ถ้าชื่อของไฟล์ PDB และชื่อของลำดับที่สอดคล้องกันใน
การจัดตำแหน่งเหมือนกัน ไฟล์ map อาจถูกละเว้น มิฉะนั้น, เธเซอุส จำเป็นต้องรู้
ลำดับใดในไฟล์การจัดตำแหน่งที่สอดคล้องกับไฟล์โครงสร้าง PDB นี้
ข้อมูลรวมอยู่ในไฟล์แผนที่ด้วยรูปแบบที่เรียบง่ายมาก (ระบุด้วย -M
ตัวเลือก). มีเพียงสองคอลัมน์ที่คั่นด้วยช่องว่าง: คอลัมน์แรกแสดงรายการ
ชื่อของไฟล์โครงสร้าง PDB ในขณะที่คอลัมน์ที่สองแสดงรายการลำดับที่สอดคล้องกัน
ชื่อตรงตามที่ระบุในไฟล์การจัดตำแหน่งหลายลำดับ

ตัวอย่างของไฟล์แผนที่:

cytc1.pdb seq1
cytc2.pdb seq2
cytc3.pdb seq3

SCREEN เอาท์พุท


เธเซอุสให้ผลลัพธ์ที่อธิบายทั้งความคืบหน้าของการซ้อนทับและหลาย ๆ
สถิติสำหรับผลสุดท้าย:

คลาสสิก LS เป็นคู่ :
RMSD ทั่วไปสำหรับการซ้อนทับ RMSD เฉลี่ยสำหรับคู่ทั้งหมด
การผสมผสานของโครงสร้างในชุด

สี่เหลี่ยมน้อยที่สุด :
ค่าเบี่ยงเบนมาตรฐานสำหรับการทับซ้อน ตามสมมติฐานทั่วไป
ไม่มีความสัมพันธ์และความแปรปรวนเท่ากัน โดยทั่วไปจะเท่ากับ RMSD จากค่าเฉลี่ย
โครงสร้าง

สูงสุด ความน่าจะเป็น :
อะนาล็อก ML ของค่าเบี่ยงเบนมาตรฐานสำหรับการซ้อนทับ เมื่อสมมติว่า
ความสัมพันธ์เป็นศูนย์ (เมทริกซ์ความแปรปรวนร่วมในแนวทแยง) ซึ่งเท่ากับ
รากที่สองของค่าเฉลี่ยฮาร์มอนิกของความแปรปรวนสำหรับแต่ละอะตอม ในทางตรงกันข้าม,
`` สี่เหลี่ยมน้อยที่สุด '' ที่ระบุข้างต้นรายงานรากที่สองของเลขคณิต
ค่าเฉลี่ยของผลต่าง ค่าเฉลี่ยฮาร์มอนิกจะน้อยกว่าเลขคณิตเสมอ
ค่าเฉลี่ย และค่าน้ำหนักเฉลี่ยฮาร์โมนิกมีค่ามากตามสัดส่วนของ
ขนาด. สิ่งนี้สมเหตุสมผลในเชิงสถิติเพราะเมื่อรวมค่าเข้าด้วยกันควร
ให้น้ำหนักโดยส่วนกลับของความแปรปรวน (ซึ่งอันที่จริงแล้ว ML . คืออะไร
วิธีการซ้อน)

ร่อแร่ เข้าสู่ระบบ โอกาส:
ความเป็นไปได้ของล็อกขอบสุดท้ายของการซ้อนทับ โดยถือว่าเมทริกซ์
การกระจายแบบเกาส์เซียนของโครงสร้างและแกมมาผกผันตามลำดับชั้น
การกระจายค่าลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วม บันทึกระยะขอบ
ความน่าจะเป็นคือความน่าจะเป็นที่รวมเมทริกซ์ความแปรปรวนร่วม

เอไอซี: เกณฑ์ข้อมูล Akaike สำหรับการซ้อนทับขั้นสุดท้าย นี่เป็นสิ่งสำคัญ
สถิติในการวิเคราะห์ความน่าจะเป็นและทฤษฎีการเลือกแบบจำลอง ช่วยให้บรรลุวัตถุประสงค์
การเปรียบเทียบแบบจำลองทางทฤษฎีหลายแบบที่มีจำนวนพารามิเตอร์ต่างกัน ใน
กรณีนี้ยิ่งตัวเลขสูงยิ่งดี มีการแลกเปลี่ยนระหว่างความพอดีกับ
ข้อมูลและจำนวนพารามิเตอร์ที่เหมาะสม การเพิ่มจำนวนของพารามิเตอร์
ในตัวแบบจะทำให้ข้อมูลมีความเหมาะสมมากขึ้น แต่ก็เพิ่ม
ความไม่แน่นอนของค่าประมาณการ เกณฑ์ AIC พบชุดค่าผสมที่ดีที่สุด
โดย (1) เพิ่มความพอดีกับข้อมูลสูงสุดในขณะที่ (2) ลดความไม่แน่นอนอันเนื่องมาจาก
จำนวนพารามิเตอร์ ในกรณีทับซ้อน เราสามารถเปรียบเทียบน้อยที่สุด
การซ้อนทับกำลังสองถึงการซ้อนทับความน่าจะเป็นสูงสุด วิธีการ (หรือ
รุ่น) ที่มี AIC สูงกว่าจะเป็นที่ต้องการ ความแตกต่างใน AIC 2 หรือมากกว่าคือ
ถือว่ามีหลักฐานทางสถิติที่ชัดเจนสำหรับแบบจำลองที่ดีกว่า

BIC: เกณฑ์ข้อมูลเบส์ คล้ายกับ AIC แต่มี Bayesian
เน้น.

รถโดยสาร ไค2:
สถิติ chi2 โดยรวมที่ลดลงสำหรับความพอดีทั้งหมด รวมถึงการหมุนเวียน
การแปล ความแปรปรวนร่วม และพารามิเตอร์แกมมาผกผัน นี่น่าจะเป็น
สถิติที่สำคัญที่สุดสำหรับการทับซ้อน ในบางกรณี แกมมาผกผัน
ความพอดีอาจจะแย่ แต่ความพอดีโดยรวมยังดีมาก อีกครั้งก็ควรจะนึกคิด
ใกล้เคียงกับ 1.0 ซึ่งจะบ่งบอกถึงความเหมาะสมอย่างยิ่ง แต่ถ้าคุณคิดว่ามันคือ
ใหญ่เกินไป ตรวจสอบให้แน่ใจว่าได้เปรียบเทียบกับ chi2 เพื่อให้พอดีช่องสี่เหลี่ยมน้อยที่สุด ของมัน
อาจจะไม่เลวร้ายขนาดนั้น chi2 ขนาดใหญ่มักบ่งบอกถึงการละเมิด
สมมติฐานของแบบจำลอง การละเมิดที่พบบ่อยที่สุดคือเมื่อมีการทับซ้อนสองหรือ
โดเมนอิสระมากขึ้นที่สามารถหมุนเวียนสัมพันธ์กัน ถ้านี่คือ
กรณีนั้นอาจจะไม่ใช่แค่การแจกแจงแบบเกาส์เดียว แต่มีอีกหลายอย่าง
ผสม Gaussians หนึ่งสำหรับแต่ละโดเมน ถ้าอย่างนั้น จะดีกว่าที่จะวางทับกัน
โดเมนอย่างอิสระ

ตามลำดับชั้น คือ (อัลฟา แกมมา) ไค2:
chi2 ที่ลดลงสำหรับความพอดีแกมมาผกผันของค่าลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วม เนื่องจาก
ก่อนหน้านี้ควรจะใกล้เคียงกับ 1.0 ค่าสองค่าในวงเล็บคือ
ML ประมาณการของพารามิเตอร์มาตราส่วนและรูปร่างตามลำดับสำหรับผกผัน
การกระจายแกมมา

หมุน, แปล โควาร์ ไค2:
สถิติ chi2 ที่ลดลงเพื่อความพอดีของโครงสร้างกับโมเดล ด้วยความดี
ความพอดีควรใกล้เคียงกับ 1.0 ซึ่งบ่งชี้ว่าข้อมูลพอดีกับ
แบบจำลองทางสถิติ ในกรณีของกำลังสองน้อยที่สุด แบบจำลองสมมติคือเมทริกซ์
การกระจายแบบเกาส์เซียนของโครงสร้างที่มีความแปรปรวนเท่ากันและไม่มีความสัมพันธ์กัน
สำหรับ ML ที่พอดี แบบจำลองที่สันนิษฐานคือความแปรปรวนไม่เท่ากันและไม่มีความสัมพันธ์กัน เช่น
คำนวณด้วย -v ตัวเลือก [ค่าเริ่มต้น] สถิตินี้มีไว้สำหรับการทับซ้อน
เท่านั้น และไม่รวมความพอดีของค่าเฉพาะของเมทริกซ์ความแปรปรวนร่วมถึง an
การกระจายแกมมาผกผัน ดู ``Omnibus chi2'' ด้านล่าง

ตามลำดับชั้น ขั้นต่ำ มี:
ความพอดีตามลำดับชั้นของการแจกแจงแกมมาผกผันจำกัดความแปรปรวนของ
อะตอมโดยทำให้อะตอมใหญ่เล็กลงและใหญ่ขึ้น สถิตินี้
รายงานความแปรปรวนที่เป็นไปได้น้อยที่สุดโดยพิจารณาจากพารามิเตอร์แกมมาผกผันที่อนุมาน

ความเบ้ เบ้ ค่า Z, โด่ง & โด่ง ค่า Z:
ความเบ้และความโด่งของสิ่งตกค้าง ทั้งสองควรเป็น 0.0 ถ้าส่วนที่เหลือพอดี
การกระจายแบบเกาส์เซียนได้อย่างลงตัว ตามด้วยค่า P สำหรับ
สถิติ. นี่เป็นการทดสอบที่เข้มงวดมาก สารตกค้างอาจไม่ใช่แบบเกาส์เซียนและ
ทว่าการหมุนโดยประมาณ การแปล และเมทริกซ์ความแปรปรวนร่วมโดยประมาณก็ยังคงเป็น
ค่อนข้างแม่นยำ

ข้อมูล คะแนน ฟรี พารามิเตอร์ ดี/พี:
จำนวนจุดข้อมูลทั้งหมดที่กำหนดโครงสร้างที่สังเกตได้ทั้งหมด จำนวน
พารามิเตอร์ที่เหมาะสมกับแบบจำลองและอัตราส่วนข้อมูลต่อพารามิเตอร์

มัธยฐาน โครงสร้าง:
โครงสร้างที่โดยรวมใกล้เคียงที่สุดกับโครงสร้างเฉลี่ย นี้สามารถ
ถือเป็นโครงสร้าง ``แบบทั่วไป'' ที่สุดในวง

รวม รอบ:
จำนวนการวนซ้ำที่อัลกอริทึมใช้เพื่อมาบรรจบกัน

เป็นเศษส่วน ความแม่นยำ:
ความแม่นยำที่แท้จริงที่อัลกอริทึมมาบรรจบกัน

เอาท์พุท ไฟล์


เธเซอุสเขียนไฟล์ต่อไปนี้:

เธเซอุส_sup.pdb
การทับซ้อนสุดท้าย หมุนไปที่แกนหลักของโครงสร้างกลาง

เธเซอุส_ave.pdb
การประมาณโครงสร้างเฉลี่ย

เธเซอุส_residuals.txt
เศษเหลือปกติของการทับซ้อน สิ่งเหล่านี้สามารถวิเคราะห์หาค่าเบี่ยงเบนได้
จากภาวะปกติ (ไม่ว่าจะพอดีกับการแจกแจงแบบเกาส์เซียนมาตรฐานหรือไม่) เช่น chi2,
ความเบ้และสถิติความโด่งขึ้นอยู่กับค่าเหล่านี้

เธเซอุส_ทรานส์เอฟ.txt
เมทริกซ์การหมุนการแปลงสุดท้ายและเวกเตอร์การแปล

เธเซอุส_variances.txt
เวกเตอร์ของความแปรปรวนโดยประมาณสำหรับแต่ละอะตอม

เมื่อคำนวณส่วนประกอบหลัก (ด้วย -P ตัวเลือก) ไฟล์ต่อไปนี้คือ
ยังผลิต:

เธเซอุส_pcvecs.txt
เวกเตอร์องค์ประกอบหลัก

เธเซอุส_pcstats.txt
สถิติอย่างง่ายสำหรับแต่ละองค์ประกอบหลัก (การโหลด อธิบายความแปรปรวน
และอื่น ๆ )

เธเซอุส_pcN_ave.pdb
โครงสร้างเฉลี่ยที่มีองค์ประกอบหลักที่ N เขียนอยู่ในอุณหภูมิ
ฟิลด์ปัจจัย

เธเซอุส_pcN.pdb
การทับซ้อนสุดท้ายด้วยองค์ประกอบหลักที่ N เขียนในอุณหภูมิ
ฟิลด์ปัจจัย ไฟล์นี้ถูกละเว้นเมื่อวางซ้อนโมเลกุลด้วย different
ลำดับของสารตกค้าง (โหมด 2)

เธเซอุส_cor.mat, เธเซอุส_cov.mat
เมทริกซ์สหสัมพันธ์อะตอมและเมทริกซ์ความแปรปรวนร่วม ตามค่าสุดท้าย
การทับซ้อน รูปแบบนี้เหมาะสำหรับการป้อนข้อมูลไปยัง GNU's อ็อกเทฟ เหล่านี้เป็น
เมทริกซ์ที่ใช้ในการวิเคราะห์องค์ประกอบหลัก

ใช้ theseus ออนไลน์โดยใช้บริการ onworks.net



โปรแกรมออนไลน์ Linux และ Windows ล่าสุด