ນີ້ແມ່ນຄໍາສັ່ງ theseus ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
ເຫຼົ່ານີ້ - ຄວາມເປັນໄປໄດ້ສູງສຸດ, ຫຼາຍ superpositions ພ້ອມກັນກັບສະຖິຕິ
ການວິເຄາະ
ສະຫຼຸບສັງລວມ
ເຫຼົ່ານີ້ [ທາງເລືອກ] pdbfile1 [pdbfile2 ... ]
ແລະ
theseus_align [ຕົວເລືອກ] -f pdbfile1 [pdbfile2 ... ]
ລາຍລະອຽດ
ເຫຼົ່ານີ້ superposes ຊຸດຂອງໂຄງສ້າງ macromolecular ພ້ອມໆກັນໂດຍໃຊ້ວິທີການຂອງ
ຄວາມເປັນໄປໄດ້ສູງສຸດ (ML), ແທນທີ່ຈະເປັນມາດຕະຖານທີ່ນ້ອຍທີ່ສຸດ-squares. ເຫຼົ່ານີ້
ສົມມຸດວ່າໂຄງສ້າງໄດ້ຖືກແຈກຢາຍຕາມການແຈກຢາຍຂອງ Matrix Gaussian
ແລະວ່າ eigenvalues ຂອງ matrix covariance atomic ໄດ້ຖືກແຈກຢາຍຕາມລໍາດັບ
ອີງຕາມການແຈກຢາຍແກມມາປີ້ນກັບກັນ. ຮູບແບບ superpositioning ML ນີ້ຜະລິດຫຼາຍ
ຜົນໄດ້ຮັບທີ່ຖືກຕ້ອງຫຼາຍຂຶ້ນໂດຍການລົງນ້ໍາຫນັກພື້ນຖານຕົວປ່ຽນແປງຂອງໂຄງສ້າງແລະ
ໂດຍການແກ້ໄຂສໍາລັບການພົວພັນລະຫວ່າງປະລໍາມະນູ.
ເຫຼົ່ານີ້ ດໍາເນີນການຢູ່ໃນສອງໂຫມດຕົ້ນຕໍ: (1) ຮູບແບບສໍາລັບການ superimposing ໂຄງສ້າງທີ່ມີຄືກັນ
ລໍາດັບແລະ (2) ຮູບແບບສໍາລັບໂຄງສ້າງທີ່ມີລໍາດັບທີ່ແຕກຕ່າງກັນແຕ່ໂຄງສ້າງທີ່ຄ້າຍຄືກັນ:
(1) ໂໝດສຳລັບການຈັດຕຳແໜ່ງ macromolecules ທີ່ມີລຳດັບ ແລະຕົວເລກທີ່ຄືກັນ
ຕົວຢ່າງຂອງ residue, ຫຼາຍຕົວແບບໃນຄອບຄົວ NMR ຫຼືຫຼາຍໂຄງສ້າງ
ຈາກຮູບແບບໄປເຊຍກັນທີ່ແຕກຕ່າງກັນຂອງທາດໂປຼຕີນດຽວກັນ.
ໃນຮູບແບບນີ້, ເຫຼົ່ານີ້ ຈະອ່ານແບບຈໍາລອງໃນທຸກໄຟລ໌ໃນເສັ້ນຄໍາສັ່ງແລະ
superpose ເຂົາເຈົ້າ.
ຕົວຢ່າງ:
ເຫຼົ່ານີ້ 1s40.pdb
ໃນຕົວຢ່າງຂ້າງເທິງ, 1s40.pdb ເປັນໄຟລ໌ pdb ຂອງ 10 ແບບ NMR.
(2) ຮູບແບບ "ການຈັດວາງ" ສໍາລັບໂຄງສ້າງ superpositioning ທີ່ມີລໍາດັບທີ່ແຕກຕ່າງກັນ,
ຕົວຢ່າງ, ໂຄງສ້າງຫຼາຍຂອງທາດໂປຼຕີນຈາກ cytochrome c ຈາກຊະນິດຕ່າງໆ
ຫຼືໂຄງສ້າງທີ່ມີການປ່ຽນແປງຫຼາຍອັນຂອງ lysozyme ໄຂ່ຂາວຂອງໄກ່.
ຮູບແບບນີ້ຮຽກຮ້ອງໃຫ້ຜູ້ໃຊ້ສະຫນອງໄຟລ໌ການຈັດລໍາດັບລໍາດັບຂອງໂຄງສ້າງ
ຖືກ superpositioned (ເບິ່ງທາງເລືອກ -A ແລະ ``ຮູບແບບໄຟລ໌'' ຂ້າງລຸ່ມນີ້). ນອກຈາກນັ້ນ, ມັນ
ອາດຈະມີຄວາມຈໍາເປັນເພື່ອສະຫນອງແຜນທີ່ທີ່ບອກ ເຫຼົ່ານີ້ ເຊິ່ງໄຟລ໌ໂຄງສ້າງ PDB
ສອດຄ້ອງກັບລໍາດັບໃດໃນການຈັດຕໍາແຫນ່ງ (ເບິ່ງທາງເລືອກ -M ແລະ ``ຮູບແບບໄຟລ໌''
ຂ້າງລຸ່ມນີ້). ໄຟລ໌ແຜນທີ່ແມ່ນບໍ່ຈໍາເປັນຖ້າຊື່ລໍາດັບແລະ pdb ທີ່ສອດຄ້ອງກັນ
ຊື່ໄຟລ໌ແມ່ນຄືກັນ. ໃນໂຫມດນີ້, ຖ້າມີຫຼາຍແບບໂຄງສ້າງຢູ່ໃນ
ໄຟລ໌ PDB, ເຫຼົ່ານີ້ ພຽງແຕ່ອ່ານຮູບແບບທໍາອິດໃນແຕ່ລະໄຟລ໌ໃນເສັ້ນຄໍາສັ່ງ. ໃນ
ຄໍາສັບຕ່າງໆອື່ນໆ, ເຫຼົ່ານີ້ ປະຕິບັດຕໍ່ໄຟລ໌ຢູ່ໃນເສັ້ນຄໍາສັ່ງຄືກັບວ່າມີພຽງແຕ່ຫນຶ່ງ
ໂຄງສ້າງຕໍ່ໄຟລ໌.
ຕົວຢ່າງ 1:
ເຫຼົ່ານີ້ -A cytc.aln -M cytc.filemap d1cih__.pdb d1csu__.pdb d1kyow_.pdb
ໃນຕົວຢ່າງຂ້າງເທິງ, d1cih__.pdb, d1csu__.pdb, ແລະ d1kyow_.pdb ແມ່ນໄຟລ໌ pdb ຂອງ
cytochrome c ໂດເມນຈາກຖານຂໍ້ມູນ SCOP.
ຕົວຢ່າງ 2:
theseus_align -f d1cih__.pdb d1csu__.pdb d1kyow_.pdb
ໃນຕົວຢ່າງນີ້, the theseus_align script ຖືກເອີ້ນໃຫ້ເຮັດວຽກຫນັກສໍາລັບທ່ານ.
ມັນຈະຄິດໄລ່ການຈັດຮຽງລໍາດັບແລະຫຼັງຈາກນັ້ນ superpose ໂດຍອີງໃສ່ການຈັດຕໍາແຫນ່ງນັ້ນ.
ສະຄຣິບ theseus_align ເອົາທາງເລືອກດຽວກັນກັບ ເຫຼົ່ານີ້ ໂຄງການ. ຫມາຍເຫດ, ໄດ້
ສອງສາມແຖວທຳອິດຂອງສະຄຣິບນີ້ຕ້ອງຖືກແກ້ໄຂສຳລັບລະບົບຂອງເຈົ້າ, ເພາະວ່າມັນເອີ້ນວ່າ
ໂຄງການຈັດລຽງລໍາດັບຫຼາຍພາຍນອກເພື່ອເຮັດການຈັດຕັ້ງ. ເບິ່ງ
ຕົວຢ່າງ/ ໄດເລກະທໍລີສໍາລັບລາຍລະອຽດເພີ່ມເຕີມ, ລວມທັງໄຟລ໌ຕົວຢ່າງ.
OPTIONS
ສູດການຄິດໄລ່ ທາງເລືອກ, ຄ່າເລີ່ມຕົ້ນ in {ວົງເລັບ}:
--ອໍາພັນ
ດໍາເນີນການພິເສດສໍາລັບໄຟລ໌ PDB ຮູບແບບ AMBER8
ຄົນສ່ວນໃຫຍ່ຈະບໍ່ຈໍາເປັນຕ້ອງໃຊ້ທາງເລືອກທີ່ຍາວນານນີ້, ເວັ້ນເສຍແຕ່ວ່າທ່ານກໍາລັງປຸງແຕ່ງ MD
ຕິດຕາມຈາກ AMBER. AMBER ໃສ່ຊື່ອະຕອມຢູ່ໃນຖັນທີ່ບໍ່ຖືກຕ້ອງໃນໄຟລ໌ PDB.
-a [ການຄັດເລືອກ]
ປະລໍາມະນູທີ່ຈະລວມຢູ່ໃນ superposition ໄດ້. ທາງເລືອກນີ້ໃຊ້ເວລາສອງປະເພດຂອງການໂຕ້ຖຽງ,
ທັງ (1) ຕົວເລກທີ່ລະບຸຊຸດອະຕອມທີ່ເລືອກໄວ້ລ່ວງໜ້າຂອງປະເພດອະຕອມ, ຫຼື (2) ຈະແຈ້ງ
PDB-style, ລາຍຊື່ທີ່ຂັ້ນດ້ວຍຈໍ້າສອງເມັດຂອງອະຕອມທີ່ຈະລວມເອົາ.
ສຳລັບຊຸດຍ່ອຍປະເພດອະຕອມທີ່ເລືອກໄວ້ກ່ອນ, ທາງເລືອກຈຳນວນເຕັມດັ່ງຕໍ່ໄປນີ້ມີໃຫ້:
· 0, alpha carbons ສໍາລັບທາດໂປຼຕີນ, C1′ atoms ສໍາລັບອາຊິດ nucleic
· 1, ກະດູກສັນຫຼັງ
· 2, ທັງຫມົດ
· 3, alpha ແລະ beta carbons
· 4, ປະລໍາມະນູຫນັກທັງຫມົດ (ບໍ່ມີ hydrogens)
ຫມາຍເຫດ, ພຽງແຕ່ -a0 ທາງເລືອກແມ່ນມີຢູ່ໃນເວລາທີ່ໂຄງສ້າງ superpositioning ກັບ
ລໍາດັບທີ່ແຕກຕ່າງກັນ.
ເພື່ອປັບແຕ່ງຊຸດປະລໍາມະນູທີ່ຊັດເຈນ, ຕ້ອງລະບຸປະເພດອະຕອມ
ແທ້ຕາມທີ່ໄດ້ລະບຸໄວ້ໃນຊ່ອງຂໍ້ມູນໄຟລ໌ PDB, ລວມທັງຊ່ອງຫວ່າງ, ແລະປະເພດອະຕອມຕ້ອງ
encapsulated ໃນເຄື່ອງຫມາຍວົງຢືມ. ປະເພດອະຕອມຫຼາຍຊະນິດຈະຕ້ອງຖືກຈຳກັດດ້ວຍຈໍ້າສອງເມັດ.
ຍົກຕົວຢ່າງ,
-a ` N : CA : C : O '
ຈະລະບຸປະເພດອະຕອມຢູ່ໃນກະດູກສັນຫຼັງ peptide.
-f ພຽງແຕ່ອ່ານຮູບແບບທໍາອິດຂອງໄຟລ໌ PDB ຫຼາຍແບບ
-h ການຊ່ວຍເຫຼືອ / ການນໍາໃຊ້
-i [nnn]
ຊໍ້າຄືນສູງສຸດ, {200}
-p [ຄວາມຖືກຕ້ອງ]
ຮ້ອງຂໍຄວາມແມ່ນຍໍາສົມທຽບສຳລັບການລວມເຂົ້າກັນ, {1e-7}
-r [ຮາກ ຊື່]
ຊື່ຮາກທີ່ຈະໃຊ້ໃນການຕັ້ງຊື່ໄຟລ໌ຜົນຜະລິດ, {theseus}
-s [nn:...]
ການເລືອກສານຕົກຄ້າງ (ຕົວຢ່າງ -s15-45:50-55), {all}
-S [nn:...]
ສ່ວນທີ່ເຫຼືອທີ່ຈະຍົກເວັ້ນ (ຕົວຢ່າງ -S15-45:50-55) {none}
ສອງທາງເລືອກທີ່ຜ່ານມາມີຮູບແບບດຽວກັນ. ໄລຍະການຕົກຄ້າງ (ຫຼືການຈັດຮຽງຖັນ).
ແມ່ນສະແດງໂດຍຈຸດເລີ່ມຕົ້ນ ແລະຈຸດສິ້ນສຸດທີ່ແຍກອອກດ້ວຍເສັ້ນຂີດ. ຫຼາຍຂອບເຂດ, ໃນໃດກໍ່ຕາມ
ຄໍາສັ່ງທີ່ມັກ, ຖືກແຍກອອກໂດຍຈໍ້າສອງເມັດ. ລະບົບຕ່ອງໂສ້ອາດຈະຖືກເລືອກໂດຍການໃຫ້
ລະບົບຕ່ອງໂສ້ ID ໃນທັນທີກ່ອນລະດັບການຕົກຄ້າງໄດ້. ຍົກຕົວຢ່າງ, -sA1-20:A40-71
ຈະລວມເອົາພຽງແຕ່ residue 1 ຫາ 20 ແລະ 40 ຫາ 70 ໃນຕ່ອງໂສ້ A. ລະບົບຕ່ອງໂສ້ບໍ່ສາມາດ
ຈະຖືກລະບຸໃນເວລາທີ່ superposing ໂຄງສ້າງທີ່ມີລໍາດັບທີ່ແຕກຕ່າງກັນ.
-v ໃຊ້ ML variance weighting (ບໍ່ມີການພົວພັນກັນ) {default}
ການປ້ອນຂໍ້ມູນ / ຜົນຜະລິດ ຕົວເລືອກ:
-A [ລໍາດັບ alignment ເອກະສານ]
ໄຟລ໌ການຈັດລໍາດັບເພື່ອໃຊ້ເປັນຄູ່ມື (ຮູບແບບ CLUSTAL ຫຼື A2M)
ສໍາລັບການນໍາໃຊ້ໃນເວລາທີ່ superposing ໂຄງສ້າງທີ່ມີລໍາດັບທີ່ແຕກຕ່າງກັນ. ເບິ່ງ ``ຮູບແບບໄຟລ໌´
ຂ້າງລຸ່ມນີ້.
-E ທາງເລືອກໃນການພິມຜູ້ຊ່ຽວຊານ
-F ພິມໄຟລ໌ FASTA ຂອງລໍາດັບໃນໄຟລ໌ PDB ແລະອອກ
ທາງເລືອກທີ່ເປັນປະໂຫຍດໃນເວລາທີ່ superposing ໂຄງສ້າງທີ່ມີລໍາດັບທີ່ແຕກຕ່າງກັນ. ໄຟລ໌
ຜົນຜະລິດທີ່ມີທາງເລືອກນີ້ສາມາດສອດຄ່ອງກັບໂຄງການການຈັດລໍາດັບຫຼາຍ
ເຊັ່ນ: CLUSTAL ຫຼື MUSCLE, ແລະໄຟລ໌ການຈັດລໍາດັບຜົນໄດ້ຮັບທີ່ໃຊ້ເປັນ ເຫຼົ່ານີ້
ການປ້ອນຂໍ້ມູນດ້ວຍ -A ທາງເລືອກ.
-h ການຊ່ວຍເຫຼືອ / ການນໍາໃຊ້
-I ພຽງແຕ່ຄິດໄລ່ສະຖິຕິສໍາລັບໄຟລ໌ປ້ອນຂໍ້ມູນ; ບໍ່ superpose
-M [ໄຟລ໌ແຜນທີ່]
ໄຟລ໌ທີ່ແຜນທີ່ໄຟລ໌ PDB ໄປຫາລໍາດັບໃນການຈັດລໍາດັບ.
ໄຟລ໌ຮູບແບບສອງຖັນແບບງ່າຍດາຍ; ເບິ່ງ ``FILE FORMATS'' ຂ້າງລຸ່ມນີ້. ໃຊ້ກັບໂໝດ 2.
-n ຢ່າຂຽນໄຟລ໌ pdb ທີ່ປ່ຽນແປງ
-o [ອ້າງອິງ ໂຄງປະກອບການ]
ເອກະສານອ້າງອີງເພື່ອ superpose ສຸດ, ພືດຫມູນວຽນທັງຫມົດແມ່ນພີ່ນ້ອງກັບຮູບແບບທໍາອິດໃນ
ໄຟລ໌ນີ້
ຕົວຢ່າງ, 'theseus -o cytc1.pdb cytc1.pdb cytc2.pdb cytc3.pdb' ຈະ superpose
ໂຄງສ້າງແລະຫມຸນ superposition ສຸດທ້າຍທັງຫມົດເພື່ອໃຫ້ໂຄງສ້າງຈາກ
cytc1.pdb ຢູ່ໃນທິດທາງດຽວກັນກັບໂຄງສ້າງໃນ cytc1.pdb PDB ຕົ້ນສະບັບ
ຍື່ນ.
-V Version
ປະຖົມ ອົງປະກອບ ການວິເຄາະ:
-C ໃຊ້ matrix covariance ສໍາລັບ PCA (correlation matrix ແມ່ນຄ່າເລີ່ມຕົ້ນ)
-P [nnn]
ຈຳນວນອົງປະກອບຫຼັກໃນການຄຳນວນ {0}
ໃນທັງສອງອັນຂ້າງເທິງ, ອົງປະກອບຫຼັກທີ່ສອດຄ້ອງກັນແມ່ນຂຽນໄວ້ໃນ B-
ພາກສະຫນາມປັດໄຈຂອງໄຟລ໌ PDB ຜົນຜະລິດ. ປົກກະຕິແລ້ວພຽງແຕ່ສອງສາມ PCs ທໍາອິດແມ່ນຂອງໃດໆ
ດອກເບ້ຍ (ອາດຈະສູງເຖິງຫົກ).
ຕົວຢ່າງ ເຫຼົ່ານີ້ 2sdf.pdb
ເຫຼົ່ານີ້ -l -r new2sdf 2sdf.pdb
ເຫຼົ່ານີ້ -s15-45 -P3 2sdf.pdb
ເຫຼົ່ານີ້ -A cytc.aln -M cytc.mapfile -o cytc1.pdb -s1-40 cytc1.pdb cytc2.pdb cytc3.pdb
cytc4.pdb
ENVIRONMENT
ທ່ານສາມາດກໍານົດການປ່ຽນແປງສະພາບແວດລ້ອມ 'PDBDIR' ກັບໄຟລ໌ PDB ຂອງທ່ານແລະ ເຫຼົ່ານີ້ ຈະ
ເບິ່ງບ່ອນນັ້ນຫຼັງຈາກໄດເລກະທໍລີທີ່ເຮັດວຽກໃນປະຈຸບັນ. ຕົວຢ່າງ, ໃນ C shell (tcsh ຫຼື
csh), ທ່ານສາມາດໃສ່ບາງສິ່ງບາງຢ່າງທີ່ຄ້າຍຄືກັບສິ່ງນີ້ໃນໄຟລ໌ .cshrc ຂອງທ່ານ:
setenv PDBDIR '/usr/share/pdbs/'
ເອກະສານ ຮູບແບບ
ເຫຼົ່ານີ້ ຈະອ່ານໄຟລ໌ຮູບແບບ PDB ມາດຕະຖານ (ເບິ່ງhttp://www.rcsb.org/pdb/>). ທຸກໆ
ໄດ້ມີການພະຍາຍາມໃຫ້ໂຄງການຍອມຮັບຮູບແບບໄຟລ໌ CNS ແລະ X-PLOR ທີ່ບໍ່ໄດ້ມາດຕະຖານ
ຍັງ.
ອີກສອງໄຟລ໌ສົມຄວນກ່າວເຖິງ, ໄຟລ໌ການຈັດລໍາດັບ ແລະໄຟລ໌ແຜນທີ່.
ລໍາດັບ alignment ເອກະສານ
ເມື່ອ superposing ໂຄງສ້າງທີ່ມີຕົວຕົນ residue ທີ່ແຕກຕ່າງກັນ (ບ່ອນທີ່ຄວາມຍາວຂອງແຕ່ລະຄົນ
macromolecules ໃນແງ່ຂອງ residue ແມ່ນບໍ່ຈໍາເປັນເທົ່າທຽມກັນ), ການຈັດລໍາດັບລໍາດັບ.
ໄຟລ໌ຕ້ອງໄດ້ຮັບການລວມສໍາລັບ ເຫຼົ່ານີ້ ເພື່ອໃຊ້ເປັນຄູ່ມື (ລະບຸໂດຍ -A ທາງເລືອກ). ເຫຼົ່ານີ້
ຍອມຮັບທັງ CLUSTAL ແລະ A2M (FASTA) ການຈັດຮູບແບບໄຟລ໌ການຈັດລໍາດັບຫຼາຍອັນ.
ໝາຍເຫດ 1: ລຳດັບ residue ໃນການຈັດຮຽງຕ້ອງກົງກັບລຳດັບ residue.
ມອບໃຫ້ຢູ່ໃນຈຸດປະສານງານຂອງໄຟລ໌ PDB. ນັ້ນແມ່ນ, ບໍ່ມີສາມາດຂາດຫາຍໄປຫຼືພິເສດ
ຕົກຄ້າງທີ່ບໍ່ກົງກັບລໍາດັບໃນໄຟລ໌ PDB. ເປັນວິທີທີ່ງ່າຍເພື່ອຮັບປະກັນ
ວ່າລໍາດັບຂອງທ່ານກົງກັບໄຟລ໌ PDB ແມ່ນເພື່ອສ້າງລໍາດັບໂດຍໃຊ້
theseus' -F ທາງເລືອກ, ເຊິ່ງຂຽນໄຟລ໌ລໍາດັບການຈັດຮູບແບບ FASTA ຂອງລະບົບຕ່ອງໂສ້ (s) ໃນ
ໄຟລ໌ PDB. ໄຟລ໌ທີ່ອອກມາດ້ວຍຕົວເລືອກນີ້ສາມາດຖືກຈັດຮຽງດ້ວຍຫຼາຍອັນ
ໂປຣແກຣມການຈັດລໍາດັບເຊັ່ນ CLUSTAL ຫຼື MUSCLE, ແລະການຈັດລໍາດັບຜົນໄດ້ຮັບ
ໄຟລ໌ທີ່ໃຊ້ເປັນ ເຫຼົ່ານີ້ ການປ້ອນຂໍ້ມູນດ້ວຍ -A ທາງເລືອກ.
ຫມາຍເຫດ 2: ທຸກໆໄຟລ໌ PDB ຕ້ອງມີລໍາດັບທີ່ສອດຄ້ອງກັນໃນການຈັດຕໍາແຫນ່ງ. ຢ່າງໃດກໍຕາມ, ບໍ່ແມ່ນ
ທຸກໆລໍາດັບໃນການຈັດລໍາດັບຕ້ອງມີໄຟລ໌ PDB ທີ່ສອດຄ້ອງກັນ. ນັ້ນແມ່ນ, ສາມາດເຮັດໄດ້
ເປັນລໍາດັບພິເສດໃນການຈັດລໍາດັບທີ່ບໍ່ໄດ້ໃຊ້ສໍາລັບການຊີ້ນໍາ superposition.
PDB -> ລໍາດັບ ໄຟລ໌ແຜນທີ່
ຖ້າຊື່ຂອງໄຟລ໌ PDB ແລະຊື່ຂອງລໍາດັບທີ່ສອດຄ້ອງກັນຢູ່ໃນ
ການຈັດຮຽງແມ່ນຄືກັນ, ໄຟລ໌ແຜນທີ່ອາດຈະຖືກລະເວັ້ນ. ຖ້າບໍ່ດັ່ງນັ້ນ, ເຫຼົ່ານີ້ ຕ້ອງການຮູ້
ເຊິ່ງລໍາດັບໃນໄຟລ໌ການຈັດຕໍາແຫນ່ງທີ່ກົງກັບໄຟລ໌ໂຄງສ້າງ PDB. ນີ້
ຂໍ້ມູນແມ່ນລວມຢູ່ໃນໄຟລ໌ແຜນທີ່ທີ່ມີຮູບແບບທີ່ງ່າຍດາຍຫຼາຍ (ສະເພາະກັບ -M
ທາງເລືອກ). ມີພຽງແຕ່ສອງຖັນທີ່ແຍກອອກໂດຍຊ່ອງຫວ່າງ: ຖັນທໍາອິດຈະສະແດງລາຍການ
ຊື່ຂອງໄຟລ໌ໂຄງສ້າງ PDB, ໃນຂະນະທີ່ຄໍລໍາທີສອງລາຍຊື່ລໍາດັບທີ່ສອດຄ້ອງກັນ
ຊື່ແທ້ຕາມທີ່ໄດ້ລະບຸໄວ້ໃນໄຟລ໌ການຈັດຮຽງລຳດັບຫຼາຍອັນ.
ຕົວຢ່າງຂອງໄຟລ໌ແຜນທີ່:
cytc1.pdb seq1
cytc2.pdb seq2
cytc3.pdb seq3
ໜ້າ ຈໍ OUTPUT
Theseus ໃຫ້ຜົນຜະລິດທີ່ອະທິບາຍເຖິງຄວາມຄືບຫນ້າຂອງ superposing ແລະຫຼາຍໆຢ່າງ
ສະຖິຕິຜົນສຸດທ້າຍ:
ຄລາສສິກ LS ຄູ່ :
RMSD ທໍາມະດາສໍາລັບ superposition, RMSD ສະເລ່ຍສໍາລັບຄູ່ທັງຫມົດ
ການປະສົມຂອງໂຄງສ້າງໃນກຸ່ມ.
ສີ່ຫຼ່ຽມນ້ອຍ :
ມາດຕະຖານ deviation ສໍາລັບ superposition, ອີງຕາມການສົມມຸດຕິຖານທໍາມະດາ
ບໍ່ມີຄວາມກ່ຽວຂ້ອງກັນ ແລະ ຄວາມແຕກຕ່າງທີ່ເທົ່າທຽມກັນ. ໂດຍພື້ນຖານແລ້ວເທົ່າກັບ RMSD ຈາກຄ່າສະເລ່ຍ
ໂຄງສ້າງ.
ສູງສຸດ ຄວາມເປັນໄປໄດ້ :
ການປຽບທຽບ ML ຂອງມາດຕະຖານ deviation ສໍາລັບ superposition. ເມື່ອສົມມຸດວ່າ
ຄວາມສຳພັນແມ່ນສູນ (a diagonal covariance matrix), ອັນນີ້ເທົ່າກັບ
ຮາກສີ່ຫຼ່ຽມຂອງຄ່າສະເລ່ຍປະສົມກົມກຽວຂອງຄວາມແຕກຕ່າງຂອງແຕ່ລະປະລໍາມະນູ. ໃນທາງກົງກັນຂ້າມ,
``ສີ່ຫຼ່ຽມນ້ອຍສຸດ '' ທີ່ໃຫ້ຂ້າງເທິງລາຍງານຮາກທີ່ສອງຂອງເລກເລກ
ຄ່າສະເລ່ຍຂອງຄວາມແຕກຕ່າງ. ຄ່າສະເລ່ຍປະສົມກົມກຽວແມ່ນໜ້ອຍກວ່າເລກຄະນິດສະເໝີ
ໂດຍສະເລ່ຍ, ແລະຄ່າສະເລ່ຍປະສົມກົມກຽວຫຼຸດລົງຄ່າໃຫຍ່ຕາມອັດຕາສ່ວນຂອງພວກມັນ
ຂະໜາດ. ນີ້ເຮັດໃຫ້ຄວາມຮູ້ສຶກທາງສະຖິຕິ, ເພາະວ່າເມື່ອລວມມູນຄ່າຫນຶ່ງຄວນ
ນ້ໍາຫນັກໃຫ້ເຂົາເຈົ້າໂດຍ reciprocal ຂອງຄວາມແຕກຕ່າງກັນຂອງເຂົາເຈົ້າ (ຊຶ່ງໃນຕົວຈິງແມ່ນສິ່ງທີ່ ML ໄດ້
ວິທີການ superposing ບໍ່).
ຂອບໃບ ຕົວເຊັນເຂົ້າ ຄວາມເປັນໄປໄດ້:
ຄວາມເປັນໄປໄດ້ຂອງບັນທຶກຂອບຂັ້ນສຸດທ້າຍຂອງ superposition, ສົມມຸດວ່າ matrix
ການແຜ່ກະຈາຍຂອງ Gaussian ຂອງໂຄງສ້າງ ແລະ gamma inverse hierarchical
ການແຈກຢາຍ eigenvalues ຂອງ matrix covariance. ບັນທຶກຂອບ
ຄວາມເປັນໄປໄດ້ແມ່ນຄວາມເປັນໄປໄດ້ທີ່ມີ matrix covariance ປະສົມປະສານອອກ.
AIC: ເງື່ອນໄຂຂໍ້ມູນ Akaike ສໍາລັບ superposition ສຸດທ້າຍ. ນີ້ແມ່ນສິ່ງສໍາຄັນ
ສະຖິຕິໃນການວິເຄາະຄວາມເປັນໄປໄດ້ ແລະທິດສະດີການເລືອກຕົວແບບ. ມັນອະນຸຍາດໃຫ້ມີຈຸດປະສົງ
ການປຽບທຽບຂອງຕົວແບບທິດສະດີຫຼາຍຕົວທີ່ມີຕົວເລກທີ່ແຕກຕ່າງກັນຂອງຕົວກໍານົດການ. ໃນ
ໃນກໍລະນີນີ້, ຈໍານວນທີ່ສູງທີ່ດີກວ່າ. ມີການຊື້ຂາຍລະຫວ່າງເຫມາະກັບ
ຂໍ້ມູນແລະຈໍານວນຕົວກໍານົດການທີ່ເຫມາະສົມ. ການເພີ່ມຈໍານວນຕົວກໍານົດການ
ໃນແບບຈໍາລອງຈະສະເຫມີໃຫ້ເຫມາະກັບຂໍ້ມູນທີ່ດີກວ່າ, ແຕ່ມັນຍັງເພີ່ມຂຶ້ນ
ຄວາມບໍ່ແນ່ນອນຂອງມູນຄ່າຄາດຄະເນ. ເງື່ອນໄຂ AIC ຊອກຫາການປະສົມປະສານທີ່ດີທີ່ສຸດ
ໂດຍ (1) maximizing ເຫມາະກັບຂໍ້ມູນໃນຂະນະທີ່ (2) ຫຼຸດຜ່ອນຄວາມບໍ່ແນ່ນອນເນື່ອງຈາກ
ຈໍານວນຂອງຕົວກໍານົດການ. ໃນກໍລະນີ superposition, ຫນຶ່ງສາມາດປຽບທຽບຫນ້ອຍທີ່ສຸດ
superposition ຮຽບຮ້ອຍເປັນ superposition ຄວາມເປັນໄປໄດ້ສູງສຸດ. ວິທີການ (ຫຼື
ຮູບແບບ) ທີ່ມີ AIC ສູງກວ່າແມ່ນມັກ. ຄວາມແຕກຕ່າງໃນ AIC ຂອງ 2 ຫຼືຫຼາຍກວ່ານັ້ນແມ່ນ
ພິຈາລະນາຫຼັກຖານສະຖິຕິທີ່ເຂັ້ມແຂງສໍາລັບຮູບແບບທີ່ດີກວ່າ.
BIC: ເກນຂໍ້ມູນ Bayesian. ຄ້າຍຄືກັນກັບ AIC, ແຕ່ມີ Bayesian
ເນັ້ນໜັກ.
Omnibus chi2:
ສະຖິຕິ chi2 ຫຼຸດລົງໂດຍລວມສໍາລັບການສອດຄ່ອງທັງຫມົດ, ລວມທັງການຫມຸນ,
ການແປ, ຄວາມແຕກຕ່າງກັນ, ແລະຕົວກໍານົດການ inverse gamma. ນີ້ອາດຈະເປັນ
ສະຖິຕິທີ່ສໍາຄັນທີ່ສຸດສໍາລັບ superposition ໄດ້. ໃນບາງກໍລະນີ, gamma ປີ້ນກັບກັນ
ພໍດີອາດຈະບໍ່ດີ, ແຕ່ພໍດີໂດຍລວມຍັງດີຫຼາຍ. ອີກເທື່ອຫນຶ່ງ, ມັນຄວນຈະເປັນທີ່ເຫມາະສົມ
ຢູ່ໃກ້ກັບ 1.0, ເຊິ່ງຈະຊີ້ໃຫ້ເຫັນເຖິງຄວາມເຫມາະສົມທີ່ສົມບູນແບບ. ຢ່າງໃດກໍຕາມ, ຖ້າທ່ານຄິດວ່າມັນແມ່ນ
ໃຫຍ່ເກີນໄປ, ໃຫ້ແນ່ໃຈວ່າສົມທຽບມັນກັບ chi2 ສໍາລັບສີ່ຫຼ່ຽມນ້ອຍທີ່ສຸດພໍດີ; ມັນ
ອາດຈະບໍ່ດີປານໃດຫຼັງຈາກທັງຫມົດ. chi2 ຂະຫນາດໃຫຍ່ມັກຈະຊີ້ໃຫ້ເຫັນເຖິງການລະເມີດ
ສົມມຸດຕິຖານຂອງຕົວແບບ. ການລະເມີດທົ່ວໄປທີ່ສຸດແມ່ນເມື່ອ superposing ສອງຫຼື
ໂດເມນເອກະລາດຫຼາຍທີ່ສາມາດ rotate ທຽບກັບກັນແລະກັນ. ຖ້ານີ້ແມ່ນ
ກໍລະນີ, ຫຼັງຈາກນັ້ນອາດຈະມີບໍ່ພຽງແຕ່ການແຜ່ກະຈາຍ Gaussian ຫນຶ່ງ, ແຕ່ຈໍານວນຫນຶ່ງ
Gaussians ປະສົມ, ຫນຶ່ງສໍາລັບແຕ່ລະໂດເມນ. ຫຼັງຈາກນັ້ນ, ມັນຈະເປັນການດີກວ່າທີ່ຈະ superpose ແຕ່ລະຄົນ
ໂດເມນເປັນເອກະລາດ.
ລຳ ດັບຊັ້ນ var (ອັນຟາ, ແກມມາ) chi2:
chi2 ທີ່ຫຼຸດລົງສໍາລັບຄວາມພໍດີຂອງແກມມາແບບປີ້ນກັນຂອງ eigenvalues matrix covariance. ເປັນ
ກ່ອນຫນ້ານີ້, ມັນຄວນຈະເປັນທີ່ເຫມາະສົມກັບ 1.0. ສອງຄ່າໃນວົງເລັບແມ່ນ
ML ການຄາດຄະເນຂອງຂະຫນາດແລະຕົວກໍານົດຮູບຮ່າງ, ຕາມລໍາດັບ, ສໍາລັບການ inverse ໄດ້
ການແຜ່ກະຈາຍ gamma.
ພືດຫມູນວຽນ, ການແປພາສາ, ໂຄວາ chi2:
ສະຖິຕິ chi2 ຫຼຸດລົງສໍາລັບຄວາມສອດຄ່ອງຂອງໂຄງສ້າງກັບຕົວແບບ. ດ້ວຍດີ
ພໍດີມັນຄວນຈະຢູ່ໃກ້ກັບ 1.0, ເຊິ່ງຊີ້ໃຫ້ເຫັນເຖິງຄວາມສອດຄ່ອງທີ່ສົມບູນແບບຂອງຂໍ້ມູນ
ຕົວແບບສະຖິຕິ. ໃນກໍລະນີຂອງສີ່ຫຼ່ຽມນ້ອຍທີ່ສຸດ, ຮູບແບບສົມມຸດຕິຖານແມ່ນ matrix
ການແຜ່ກະຈາຍຂອງ Gaussian ຂອງໂຄງສ້າງທີ່ມີຄວາມແຕກຕ່າງກັນເທົ່າທຽມກັນແລະບໍ່ມີການພົວພັນກັນ.
ສໍາລັບ ML ເຫມາະ, ແບບສົມມຸດຕິຖານແມ່ນຄວາມແຕກຕ່າງທີ່ບໍ່ເທົ່າທຽມກັນແລະບໍ່ມີການພົວພັນກັນ, ຍ້ອນວ່າ.
ຄິດໄລ່ດ້ວຍ -v ທາງເລືອກ [ຄ່າເລີ່ມຕົ້ນ]. ສະຖິຕິນີ້ແມ່ນສໍາລັບ superposition
ເທົ່ານັ້ນ, ແລະບໍ່ລວມເຖິງຄວາມເໝາະສົມຂອງຄ່າຂອງຄູ່ຄວາມຜັນຜວນ matrix eigenvalues ກັບ an
ການແຈກຢາຍແກມມາປີ້ນກັບກັນ. ເບິ່ງ ``Omnibus chi2'' ຂ້າງລຸ່ມນີ້.
ລຳ ດັບຊັ້ນ ຕໍາ່ສຸດທີ່ ມີ:
ຄວາມເໝາະສົມຕາມລຳດັບຂອງການແຈກຢາຍແກມມາແບບປີ້ນກັນຈຳກັດຄວາມແປປວນຂອງ
ປະລໍາມະນູໂດຍການເຮັດໃຫ້ຂະຫນາດໃຫຍ່ຂະຫນາດນ້ອຍກວ່າແລະຂະຫນາດນ້ອຍຂະຫນາດໃຫຍ່. ສະຖິຕິນີ້
ລາຍງານຄວາມຜັນຜວນທີ່ເປັນໄປໄດ້ຕໍ່າສຸດທີ່ໃຫ້ຄ່າ inverse gamma parameters.
ຄວາມອ່ອນໂຍນ, skewness Z-value, kurtosis & kurtosis Z-value:
skewness ແລະ kurtosis ຂອງ residuals ໄດ້. ທັງສອງຄວນຈະເປັນ 0.0 ຖ້າສານຕົກຄ້າງພໍດີ
ການແຜ່ກະຈາຍ Gaussian ຢ່າງສົມບູນ. ພວກເຂົາເຈົ້າແມ່ນປະຕິບັດຕາມໂດຍ P-value ສໍາລັບ
ສະຖິຕິ. ນີ້ແມ່ນການທົດສອບທີ່ເຂັ້ມງວດຫຼາຍ; residuals ສາມາດຫຼາຍທີ່ບໍ່ແມ່ນ Gaussian ແລະ
ຢ່າງໃດກໍຕາມ, ການຫມຸນ, ການແປ, ແລະ matrix sibariance ຄາດຄະເນອາດຈະຍັງຄົງຢູ່
ຖືກຕ້ອງຫຼາຍ.
ຂໍ້ມູນ ຄະແນນ, Free params, D/P:
ຈໍານວນທັງຫມົດຂອງຂໍ້ມູນທີ່ໄດ້ຮັບການສັງເກດໂຄງສ້າງທັງຫມົດ, ຈໍານວນຂອງ
ຕົວກໍານົດການທີ່ເຫມາະສົມກັບຕົວແບບ, ແລະອັດຕາສ່ວນຂໍ້ມູນຕໍ່ພາລາມິເຕີ.
Median ໂຄງສ້າງ:
ໂຄງປະກອບການໂດຍລວມແມ່ນຄ້າຍຄືກັນກັບໂຄງສ້າງສະເລ່ຍ. ນີ້ສາມາດເປັນ
ຖືວ່າເປັນໂຄງສ້າງ 'ປົກກະຕິ' ທີ່ສຸດໃນກຸ່ມ.
ທັງຫມົດ ຮອບ:
ຈໍານວນຂອງການເຮັດຊ້ຳທີ່ວິທີການໄດ້ເອົາມາເຂົ້າກັນ.
ແຕ່ສ່ວນຫນຶ່ງ ຄວາມຊັດເຈນ:
ຄວາມແມ່ນຍໍາທີ່ແທ້ຈິງທີ່ algorithm converged ກັບ.
OUTPUT ເອກະສານ
Theseus ຂຽນອອກໄຟລ໌ຕໍ່ໄປນີ້:
theseus_sup.pdb
superposition ສຸດທ້າຍ, rotated ກັບແກນຫຼັກການຂອງໂຄງສ້າງສະເລ່ຍ.
theseus_ave.pdb
ການຄາດຄະເນຂອງໂຄງສ້າງສະເລ່ຍ.
theseus_residuals.txt
ການຕົກຄ້າງປົກກະຕິຂອງ superposition. ເຫຼົ່ານີ້ສາມາດໄດ້ຮັບການວິເຄາະສໍາລັບການ deviations
ຈາກປົກກະຕິ (ບໍ່ວ່າພວກມັນເຫມາະສົມກັບການແຈກຢາຍ Gaussian ມາດຕະຖານ). ເຊັ່ນ: chi2,
skewness, ແລະສະຖິຕິ kurtosis ແມ່ນອີງໃສ່ຄຸນຄ່າເຫຼົ່ານີ້.
theseus_transf.txt
matrices ພືດຫມູນວຽນການຫັນເປັນສຸດທ້າຍແລະ vectors ການແປພາສາ.
theseus_variances.txt
vector ຂອງຄວາມແຕກຕ່າງທີ່ຄາດຄະເນສໍາລັບແຕ່ລະປະລໍາມະນູ.
ເມື່ອອົງປະກອບຫຼັກຖືກຄິດໄລ່ (ກັບ -P option), ໄຟລ໌ຕໍ່ໄປນີ້ແມ່ນ
ຍັງຜະລິດ:
theseus_pcvecs.txt
vectors ອົງປະກອບຕົ້ນຕໍ.
theseus_pcstats.txt
ສະຖິຕິທີ່ງ່າຍດາຍສໍາລັບແຕ່ລະອົງປະກອບຫຼັກການ (ການໂຫຼດ, ຄວາມແຕກຕ່າງອະທິບາຍ,
ແລະອື່ນໆ).
theseus_pcN_ave.pdb
ໂຄງສ້າງສະເລ່ຍທີ່ມີອົງປະກອບຫຼັກ Nth ຂຽນໃນອຸນຫະພູມ
ພາກສະຫນາມປັດໄຈ.
theseus_pcN.pdb
superposition ສຸດທ້າຍທີ່ມີອົງປະກອບຕົ້ນຕໍ Nth ຂຽນໃນອຸນຫະພູມ
ພາກສະຫນາມປັດໄຈ. ໄຟລ໌ນີ້ຈະຖືກລະເວັ້ນເມື່ອ superposing ໂມເລກຸນທີ່ມີຄວາມແຕກຕ່າງ
ລໍາດັບ residue (mode 2).
theseus_cor.mat, theseus_cov.mat
ມາຕຣິກເບື້ອງຄວາມສຳພັນປະລໍາມະນູ ແລະ matrices covariance, ອີງໃສ່ຂັ້ນສຸດທ້າຍ
superposition. ຮູບແບບແມ່ນເຫມາະສົມສໍາລັບການປ້ອນຂໍ້ມູນໃສ່ GNU's octave. ເຫຼົ່ານີ້ແມ່ນ
matrices ທີ່ໃຊ້ໃນການວິເຄາະອົງປະກອບຫຼັກ.
ໃຊ້ theseus ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net
