GoGPT Best VPN GoSearch

OnWorks favicon

theseus - ອອນລາຍໃນຄລາວ

ດໍາເນີນການເຫຼົ່ານີ້ຢູ່ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີຜ່ານ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ນີ້ແມ່ນຄໍາສັ່ງ theseus ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ໂຄງການ:

NAME


ເຫຼົ່ານີ້ - ຄວາມເປັນໄປໄດ້ສູງສຸດ, ຫຼາຍ superpositions ພ້ອມກັນກັບສະຖິຕິ
ການວິເຄາະ

ສະຫຼຸບສັງລວມ


ເຫຼົ່ານີ້ [ທາງເລືອກ] pdbfile1 [pdbfile2 ... ]

ແລະ

theseus_align [ຕົວເລືອກ] -f pdbfile1 [pdbfile2 ... ]

ລາຍລະອຽດ


ເຫຼົ່ານີ້ superposes ຊຸດຂອງໂຄງສ້າງ macromolecular ພ້ອມໆກັນໂດຍໃຊ້ວິທີການຂອງ
ຄວາມ​ເປັນ​ໄປ​ໄດ້​ສູງ​ສຸດ (ML​)​, ແທນ​ທີ່​ຈະ​ເປັນ​ມາດ​ຕະ​ຖານ​ທີ່​ນ້ອຍ​ທີ່​ສຸດ​-squares​. ເຫຼົ່ານີ້
ສົມມຸດວ່າໂຄງສ້າງໄດ້ຖືກແຈກຢາຍຕາມການແຈກຢາຍຂອງ Matrix Gaussian
ແລະວ່າ eigenvalues ​​ຂອງ matrix covariance atomic ໄດ້ຖືກແຈກຢາຍຕາມລໍາດັບ
ອີງຕາມການແຈກຢາຍແກມມາປີ້ນກັບກັນ. ຮູບແບບ superpositioning ML ນີ້ຜະລິດຫຼາຍ
ຜົນ​ໄດ້​ຮັບ​ທີ່​ຖືກ​ຕ້ອງ​ຫຼາຍ​ຂຶ້ນ​ໂດຍ​ການ​ລົງ​ນ​້​ໍາ​ຫນັກ​ພື້ນ​ຖານ​ຕົວ​ປ່ຽນ​ແປງ​ຂອງ​ໂຄງ​ສ້າງ​ແລະ​
ໂດຍ​ການ​ແກ້​ໄຂ​ສໍາ​ລັບ​ການ​ພົວ​ພັນ​ລະ​ຫວ່າງ​ປະ​ລໍາ​ມະ​ນູ​.

ເຫຼົ່ານີ້ ດໍາເນີນການຢູ່ໃນສອງໂຫມດຕົ້ນຕໍ: (1) ຮູບແບບສໍາລັບການ superimposing ໂຄງສ້າງທີ່ມີຄືກັນ
ລໍາດັບແລະ (2) ຮູບແບບສໍາລັບໂຄງສ້າງທີ່ມີລໍາດັບທີ່ແຕກຕ່າງກັນແຕ່ໂຄງສ້າງທີ່ຄ້າຍຄືກັນ:

(1) ໂໝດສຳລັບການຈັດຕຳແໜ່ງ macromolecules ທີ່ມີລຳດັບ ແລະຕົວເລກທີ່ຄືກັນ
ຕົວຢ່າງຂອງ residue, ຫຼາຍຕົວແບບໃນຄອບຄົວ NMR ຫຼືຫຼາຍໂຄງສ້າງ
ຈາກຮູບແບບໄປເຊຍກັນທີ່ແຕກຕ່າງກັນຂອງທາດໂປຼຕີນດຽວກັນ.

ໃນ​ຮູບ​ແບບ​ນີ້​, ເຫຼົ່ານີ້ ຈະອ່ານແບບຈໍາລອງໃນທຸກໄຟລ໌ໃນເສັ້ນຄໍາສັ່ງແລະ
superpose ເຂົາເຈົ້າ.

ຕົວຢ່າງ:

ເຫຼົ່ານີ້ 1s40.pdb

ໃນຕົວຢ່າງຂ້າງເທິງ, 1s40.pdb ເປັນໄຟລ໌ pdb ຂອງ 10 ແບບ NMR.

(2) ຮູບແບບ "ການຈັດວາງ" ສໍາລັບໂຄງສ້າງ superpositioning ທີ່ມີລໍາດັບທີ່ແຕກຕ່າງກັນ,
ຕົວຢ່າງ, ໂຄງສ້າງຫຼາຍຂອງທາດໂປຼຕີນຈາກ cytochrome c ຈາກຊະນິດຕ່າງໆ
ຫຼືໂຄງສ້າງທີ່ມີການປ່ຽນແປງຫຼາຍອັນຂອງ lysozyme ໄຂ່ຂາວຂອງໄກ່.

ຮູບແບບນີ້ຮຽກຮ້ອງໃຫ້ຜູ້ໃຊ້ສະຫນອງໄຟລ໌ການຈັດລໍາດັບລໍາດັບຂອງໂຄງສ້າງ
ຖືກ superpositioned (ເບິ່ງທາງເລືອກ -A ແລະ ``ຮູບແບບໄຟລ໌'' ຂ້າງລຸ່ມນີ້). ນອກຈາກນັ້ນ, ມັນ
ອາດຈະມີຄວາມຈໍາເປັນເພື່ອສະຫນອງແຜນທີ່ທີ່ບອກ ເຫຼົ່ານີ້ ເຊິ່ງໄຟລ໌ໂຄງສ້າງ PDB
ສອດຄ້ອງກັບລໍາດັບໃດໃນການຈັດຕໍາແຫນ່ງ (ເບິ່ງທາງເລືອກ -M ແລະ ``ຮູບແບບໄຟລ໌''
ຂ້າງລຸ່ມນີ້). ໄຟລ໌ແຜນທີ່ແມ່ນບໍ່ຈໍາເປັນຖ້າຊື່ລໍາດັບແລະ pdb ທີ່ສອດຄ້ອງກັນ
ຊື່ໄຟລ໌ແມ່ນຄືກັນ. ໃນໂຫມດນີ້, ຖ້າມີຫຼາຍແບບໂຄງສ້າງຢູ່ໃນ
ໄຟລ​໌ PDB​, ເຫຼົ່ານີ້ ພຽງແຕ່ອ່ານຮູບແບບທໍາອິດໃນແຕ່ລະໄຟລ໌ໃນເສັ້ນຄໍາສັ່ງ. ໃນ
ຄໍາສັບຕ່າງໆອື່ນໆ, ເຫຼົ່ານີ້ ປະຕິບັດຕໍ່ໄຟລ໌ຢູ່ໃນເສັ້ນຄໍາສັ່ງຄືກັບວ່າມີພຽງແຕ່ຫນຶ່ງ
ໂຄງສ້າງຕໍ່ໄຟລ໌.

ຕົວຢ່າງ 1:

ເຫຼົ່ານີ້ -A cytc.aln -M cytc.filemap d1cih__.pdb d1csu__.pdb d1kyow_.pdb

ໃນຕົວຢ່າງຂ້າງເທິງ, d1cih__.pdb, d1csu__.pdb, ແລະ d1kyow_.pdb ແມ່ນໄຟລ໌ pdb ຂອງ
cytochrome c ໂດເມນຈາກຖານຂໍ້ມູນ SCOP.

ຕົວຢ່າງ 2:

theseus_align -f d1cih__.pdb d1csu__.pdb d1kyow_.pdb

ໃນຕົວຢ່າງນີ້, the theseus_align script ຖືກເອີ້ນໃຫ້ເຮັດວຽກຫນັກສໍາລັບທ່ານ.
ມັນຈະຄິດໄລ່ການຈັດຮຽງລໍາດັບແລະຫຼັງຈາກນັ້ນ superpose ໂດຍອີງໃສ່ການຈັດຕໍາແຫນ່ງນັ້ນ.
ສະຄຣິບ theseus_align ເອົາທາງເລືອກດຽວກັນກັບ ເຫຼົ່ານີ້ ໂຄງການ. ຫມາຍເຫດ, ໄດ້
ສອງສາມແຖວທຳອິດຂອງສະຄຣິບນີ້ຕ້ອງຖືກແກ້ໄຂສຳລັບລະບົບຂອງເຈົ້າ, ເພາະວ່າມັນເອີ້ນວ່າ
ໂຄງ​ການ​ຈັດ​ລຽງ​ລໍາ​ດັບ​ຫຼາຍ​ພາຍ​ນອກ​ເພື່ອ​ເຮັດ​ການ​ຈັດ​ຕັ້ງ​. ເບິ່ງ
ຕົວຢ່າງ/ ໄດເລກະທໍລີສໍາລັບລາຍລະອຽດເພີ່ມເຕີມ, ລວມທັງໄຟລ໌ຕົວຢ່າງ.

OPTIONS


ສູດການຄິດໄລ່ ທາງເລືອກ, ຄ່າເລີ່ມຕົ້ນ in {ວົງເລັບ}:
--ອໍາພັນ
ດໍາເນີນການພິເສດສໍາລັບໄຟລ໌ PDB ຮູບແບບ AMBER8

ຄົນສ່ວນໃຫຍ່ຈະບໍ່ຈໍາເປັນຕ້ອງໃຊ້ທາງເລືອກທີ່ຍາວນານນີ້, ເວັ້ນເສຍແຕ່ວ່າທ່ານກໍາລັງປຸງແຕ່ງ MD
ຕິດຕາມຈາກ AMBER. AMBER ໃສ່ຊື່ອະຕອມຢູ່ໃນຖັນທີ່ບໍ່ຖືກຕ້ອງໃນໄຟລ໌ PDB.

-a [ການຄັດເລືອກ]
ປະລໍາມະນູທີ່ຈະລວມຢູ່ໃນ superposition ໄດ້. ທາງເລືອກນີ້ໃຊ້ເວລາສອງປະເພດຂອງການໂຕ້ຖຽງ,
ທັງ (1) ຕົວເລກທີ່ລະບຸຊຸດອະຕອມທີ່ເລືອກໄວ້ລ່ວງໜ້າຂອງປະເພດອະຕອມ, ຫຼື (2) ຈະແຈ້ງ
PDB-style, ລາຍຊື່ທີ່ຂັ້ນດ້ວຍຈໍ້າສອງເມັດຂອງອະຕອມທີ່ຈະລວມເອົາ.

ສຳ​ລັບ​ຊຸດ​ຍ່ອຍ​ປະ​ເພດ​ອະ​ຕອມ​ທີ່​ເລືອກ​ໄວ້​ກ່ອນ, ທາງ​ເລືອກ​ຈຳ​ນວນ​ເຕັມ​ດັ່ງ​ຕໍ່​ໄປ​ນີ້​ມີ​ໃຫ້:

· 0, alpha carbons ສໍາລັບທາດໂປຼຕີນ, C1′ atoms ສໍາລັບອາຊິດ nucleic
· 1, ກະດູກສັນຫຼັງ
· 2, ທັງຫມົດ
· 3, alpha ແລະ beta carbons
· 4, ປະລໍາມະນູຫນັກທັງຫມົດ (ບໍ່ມີ hydrogens)

ຫມາຍເຫດ, ພຽງແຕ່ -a0 ທາງເລືອກແມ່ນມີຢູ່ໃນເວລາທີ່ໂຄງສ້າງ superpositioning ກັບ
ລໍາດັບທີ່ແຕກຕ່າງກັນ.

ເພື່ອປັບແຕ່ງຊຸດປະລໍາມະນູທີ່ຊັດເຈນ, ຕ້ອງລະບຸປະເພດອະຕອມ
ແທ້ຕາມທີ່ໄດ້ລະບຸໄວ້ໃນຊ່ອງຂໍ້ມູນໄຟລ໌ PDB, ລວມທັງຊ່ອງຫວ່າງ, ແລະປະເພດອະຕອມຕ້ອງ
encapsulated ໃນ​ເຄື່ອງ​ຫມາຍ​ວົງ​ຢືມ​. ປະເພດອະຕອມຫຼາຍຊະນິດຈະຕ້ອງຖືກຈຳກັດດ້ວຍຈໍ້າສອງເມັດ.
ຍົກ​ຕົວ​ຢ່າງ,

-a ` N : CA : C : O '

ຈະລະບຸປະເພດອະຕອມຢູ່ໃນກະດູກສັນຫຼັງ peptide.

-f ພຽງແຕ່ອ່ານຮູບແບບທໍາອິດຂອງໄຟລ໌ PDB ຫຼາຍແບບ

-h ການ​ຊ່ວຍ​ເຫຼືອ / ການ​ນໍາ​ໃຊ້​

-i [nnn]
ຊໍ້າຄືນສູງສຸດ, {200}

-p [ຄວາມຖືກຕ້ອງ]
ຮ້ອງຂໍຄວາມແມ່ນຍໍາສົມທຽບສຳລັບການລວມເຂົ້າກັນ, {1e-7}

-r [ຮາກ ຊື່]
ຊື່ຮາກທີ່ຈະໃຊ້ໃນການຕັ້ງຊື່ໄຟລ໌ຜົນຜະລິດ, {theseus}

-s [nn:...]
ການເລືອກສານຕົກຄ້າງ (ຕົວຢ່າງ -s15-45:50-55), {all}

-S [nn:...]
ສ່ວນທີ່ເຫຼືອທີ່ຈະຍົກເວັ້ນ (ຕົວຢ່າງ -S15-45:50-55) {none}

ສອງທາງເລືອກທີ່ຜ່ານມາມີຮູບແບບດຽວກັນ. ໄລຍະການຕົກຄ້າງ (ຫຼືການຈັດຮຽງຖັນ).
ແມ່ນສະແດງໂດຍຈຸດເລີ່ມຕົ້ນ ແລະຈຸດສິ້ນສຸດທີ່ແຍກອອກດ້ວຍເສັ້ນຂີດ. ຫຼາຍຂອບເຂດ, ໃນໃດກໍ່ຕາມ
ຄໍາສັ່ງທີ່ມັກ, ຖືກແຍກອອກໂດຍຈໍ້າສອງເມັດ. ລະບົບຕ່ອງໂສ້ອາດຈະຖືກເລືອກໂດຍການໃຫ້
ລະ​ບົບ​ຕ່ອງ​ໂສ້ ID ໃນ​ທັນ​ທີ​ກ່ອນ​ລະ​ດັບ​ການ​ຕົກ​ຄ້າງ​ໄດ້​. ຍົກ​ຕົວ​ຢ່າງ, -sA1-20:A40-71
ຈະລວມເອົາພຽງແຕ່ residue 1 ຫາ 20 ແລະ 40 ຫາ 70 ໃນຕ່ອງໂສ້ A. ລະບົບຕ່ອງໂສ້ບໍ່ສາມາດ
ຈະຖືກລະບຸໃນເວລາທີ່ superposing ໂຄງສ້າງທີ່ມີລໍາດັບທີ່ແຕກຕ່າງກັນ.

-v ໃຊ້ ML variance weighting (ບໍ່ມີການພົວພັນກັນ) {default}

ການປ້ອນຂໍ້ມູນ / ຜົນຜະລິດ ຕົວເລືອກ:
-A [ລໍາດັບ alignment ເອກະສານ]
ໄຟລ໌ການຈັດລໍາດັບເພື່ອໃຊ້ເປັນຄູ່ມື (ຮູບແບບ CLUSTAL ຫຼື A2M)

ສໍາລັບການນໍາໃຊ້ໃນເວລາທີ່ superposing ໂຄງສ້າງທີ່ມີລໍາດັບທີ່ແຕກຕ່າງກັນ. ເບິ່ງ ``ຮູບແບບໄຟລ໌´
ຂ້າງລຸ່ມນີ້.

-E ທາງເລືອກໃນການພິມຜູ້ຊ່ຽວຊານ

-F ພິມໄຟລ໌ FASTA ຂອງລໍາດັບໃນໄຟລ໌ PDB ແລະອອກ

ທາງເລືອກທີ່ເປັນປະໂຫຍດໃນເວລາທີ່ superposing ໂຄງສ້າງທີ່ມີລໍາດັບທີ່ແຕກຕ່າງກັນ. ໄຟລ໌
ຜົນຜະລິດທີ່ມີທາງເລືອກນີ້ສາມາດສອດຄ່ອງກັບໂຄງການການຈັດລໍາດັບຫຼາຍ
ເຊັ່ນ: CLUSTAL ຫຼື MUSCLE, ແລະໄຟລ໌ການຈັດລໍາດັບຜົນໄດ້ຮັບທີ່ໃຊ້ເປັນ ເຫຼົ່ານີ້
ການປ້ອນຂໍ້ມູນດ້ວຍ -A ທາງເລືອກ.

-h ການ​ຊ່ວຍ​ເຫຼືອ / ການ​ນໍາ​ໃຊ້​

-I ພຽງແຕ່ຄິດໄລ່ສະຖິຕິສໍາລັບໄຟລ໌ປ້ອນຂໍ້ມູນ; ບໍ່ superpose

-M [ໄຟລ໌ແຜນທີ່]
ໄຟລ໌ທີ່ແຜນທີ່ໄຟລ໌ PDB ໄປຫາລໍາດັບໃນການຈັດລໍາດັບ.

ໄຟລ໌ຮູບແບບສອງຖັນແບບງ່າຍດາຍ; ເບິ່ງ ``FILE FORMATS'' ຂ້າງລຸ່ມນີ້. ໃຊ້ກັບໂໝດ 2.

-n ຢ່າຂຽນໄຟລ໌ pdb ທີ່ປ່ຽນແປງ

-o [ອ້າງອິງ ໂຄງປະກອບການ]
ເອກະສານອ້າງອີງເພື່ອ superpose ສຸດ, ພືດຫມູນວຽນທັງຫມົດແມ່ນພີ່ນ້ອງກັບຮູບແບບທໍາອິດໃນ
ໄຟລ໌ນີ້

ຕົວຢ່າງ, 'theseus -o cytc1.pdb cytc1.pdb cytc2.pdb cytc3.pdb' ຈະ superpose
ໂຄງສ້າງແລະຫມຸນ superposition ສຸດທ້າຍທັງຫມົດເພື່ອໃຫ້ໂຄງສ້າງຈາກ
cytc1.pdb ຢູ່ໃນທິດທາງດຽວກັນກັບໂຄງສ້າງໃນ cytc1.pdb PDB ຕົ້ນສະບັບ
ຍື່ນ.

-V Version

ປະຖົມ ອົງປະກອບ ການວິເຄາະ:
-C ໃຊ້ matrix covariance ສໍາລັບ PCA (correlation matrix ແມ່ນຄ່າເລີ່ມຕົ້ນ)

-P [nnn]
ຈຳນວນອົງປະກອບຫຼັກໃນການຄຳນວນ {0}

ໃນທັງສອງອັນຂ້າງເທິງ, ອົງປະກອບຫຼັກທີ່ສອດຄ້ອງກັນແມ່ນຂຽນໄວ້ໃນ B-
ພາກສະຫນາມປັດໄຈຂອງໄຟລ໌ PDB ຜົນຜະລິດ. ປົກກະຕິແລ້ວພຽງແຕ່ສອງສາມ PCs ທໍາອິດແມ່ນຂອງໃດໆ
ດອກເບ້ຍ (ອາດຈະສູງເຖິງຫົກ).

ຕົວຢ່າງ ເຫຼົ່ານີ້ 2sdf.pdb

ເຫຼົ່ານີ້ -l -r new2sdf 2sdf.pdb

ເຫຼົ່ານີ້ -s15-45 -P3 2sdf.pdb

ເຫຼົ່ານີ້ -A cytc.aln -M cytc.mapfile -o cytc1.pdb -s1-40 cytc1.pdb cytc2.pdb cytc3.pdb
cytc4.pdb

ENVIRONMENT


ທ່ານ​ສາ​ມາດ​ກໍາ​ນົດ​ການ​ປ່ຽນ​ແປງ​ສະ​ພາບ​ແວດ​ລ້ອມ 'PDBDIR​' ກັບ​ໄຟລ​໌ PDB ຂອງ​ທ່ານ​ແລະ​ ເຫຼົ່ານີ້ ຈະ
ເບິ່ງບ່ອນນັ້ນຫຼັງຈາກໄດເລກະທໍລີທີ່ເຮັດວຽກໃນປະຈຸບັນ. ຕົວຢ່າງ, ໃນ C shell (tcsh ຫຼື
csh), ທ່ານສາມາດໃສ່ບາງສິ່ງບາງຢ່າງທີ່ຄ້າຍຄືກັບສິ່ງນີ້ໃນໄຟລ໌ .cshrc ຂອງທ່ານ:

setenv PDBDIR '/usr/share/pdbs/'

ເອກະສານ ຮູບແບບ


ເຫຼົ່ານີ້ ຈະອ່ານໄຟລ໌ຮູບແບບ PDB ມາດຕະຖານ (ເບິ່ງhttp://www.rcsb.org/pdb/>). ທຸກໆ
ໄດ້ມີການພະຍາຍາມໃຫ້ໂຄງການຍອມຮັບຮູບແບບໄຟລ໌ CNS ແລະ X-PLOR ທີ່ບໍ່ໄດ້ມາດຕະຖານ
ຍັງ.

ອີກສອງໄຟລ໌ສົມຄວນກ່າວເຖິງ, ໄຟລ໌ການຈັດລໍາດັບ ແລະໄຟລ໌ແຜນທີ່.

ລໍາດັບ alignment ເອກະສານ
ເມື່ອ superposing ໂຄງສ້າງທີ່ມີຕົວຕົນ residue ທີ່ແຕກຕ່າງກັນ (ບ່ອນທີ່ຄວາມຍາວຂອງແຕ່ລະຄົນ
macromolecules ໃນແງ່ຂອງ residue ແມ່ນບໍ່ຈໍາເປັນເທົ່າທຽມກັນ), ການຈັດລໍາດັບລໍາດັບ.
ໄຟລ໌ຕ້ອງໄດ້ຮັບການລວມສໍາລັບ ເຫຼົ່ານີ້ ເພື່ອໃຊ້ເປັນຄູ່ມື (ລະບຸໂດຍ -A ທາງ​ເລືອກ). ເຫຼົ່ານີ້
ຍອມຮັບທັງ CLUSTAL ແລະ A2M (FASTA) ການຈັດຮູບແບບໄຟລ໌ການຈັດລໍາດັບຫຼາຍອັນ.

ໝາຍເຫດ 1: ລຳດັບ residue ໃນການຈັດຮຽງຕ້ອງກົງກັບລຳດັບ residue.
ມອບໃຫ້ຢູ່ໃນຈຸດປະສານງານຂອງໄຟລ໌ PDB. ນັ້ນແມ່ນ, ບໍ່ມີສາມາດຂາດຫາຍໄປຫຼືພິເສດ
ຕົກຄ້າງທີ່ບໍ່ກົງກັບລໍາດັບໃນໄຟລ໌ PDB. ເປັນວິທີທີ່ງ່າຍເພື່ອຮັບປະກັນ
ວ່າລໍາດັບຂອງທ່ານກົງກັບໄຟລ໌ PDB ແມ່ນເພື່ອສ້າງລໍາດັບໂດຍໃຊ້
theseus' -F ທາງເລືອກ, ເຊິ່ງຂຽນໄຟລ໌ລໍາດັບການຈັດຮູບແບບ FASTA ຂອງລະບົບຕ່ອງໂສ້ (s) ໃນ
ໄຟລ໌ PDB. ໄຟລ໌ທີ່ອອກມາດ້ວຍຕົວເລືອກນີ້ສາມາດຖືກຈັດຮຽງດ້ວຍຫຼາຍອັນ
ໂປຣແກຣມການຈັດລໍາດັບເຊັ່ນ CLUSTAL ຫຼື MUSCLE, ແລະການຈັດລໍາດັບຜົນໄດ້ຮັບ
ໄຟລ໌ທີ່ໃຊ້ເປັນ ເຫຼົ່ານີ້ ການປ້ອນຂໍ້ມູນດ້ວຍ -A ທາງເລືອກ.

ຫມາຍເຫດ 2: ທຸກໆໄຟລ໌ PDB ຕ້ອງມີລໍາດັບທີ່ສອດຄ້ອງກັນໃນການຈັດຕໍາແຫນ່ງ. ຢ່າງໃດກໍຕາມ, ບໍ່ແມ່ນ
ທຸກໆລໍາດັບໃນການຈັດລໍາດັບຕ້ອງມີໄຟລ໌ PDB ທີ່ສອດຄ້ອງກັນ. ນັ້ນແມ່ນ, ສາມາດເຮັດໄດ້
ເປັນລໍາດັບພິເສດໃນການຈັດລໍາດັບທີ່ບໍ່ໄດ້ໃຊ້ສໍາລັບການຊີ້ນໍາ superposition.

PDB -> ລໍາດັບ ໄຟລ໌ແຜນທີ່
ຖ້າຊື່ຂອງໄຟລ໌ PDB ແລະຊື່ຂອງລໍາດັບທີ່ສອດຄ້ອງກັນຢູ່ໃນ
ການຈັດຮຽງແມ່ນຄືກັນ, ໄຟລ໌ແຜນທີ່ອາດຈະຖືກລະເວັ້ນ. ຖ້າບໍ່ດັ່ງນັ້ນ, ເຫຼົ່ານີ້ ຕ້ອງການຮູ້
ເຊິ່ງລໍາດັບໃນໄຟລ໌ການຈັດຕໍາແຫນ່ງທີ່ກົງກັບໄຟລ໌ໂຄງສ້າງ PDB. ນີ້
ຂໍ້​ມູນ​ແມ່ນ​ລວມ​ຢູ່​ໃນ​ໄຟລ​໌​ແຜນ​ທີ່​ທີ່​ມີ​ຮູບ​ແບບ​ທີ່​ງ່າຍ​ດາຍ​ຫຼາຍ (ສະ​ເພາະ​ກັບ -M
ທາງ​ເລືອກ). ມີພຽງແຕ່ສອງຖັນທີ່ແຍກອອກໂດຍຊ່ອງຫວ່າງ: ຖັນທໍາອິດຈະສະແດງລາຍການ
ຊື່ຂອງໄຟລ໌ໂຄງສ້າງ PDB, ໃນຂະນະທີ່ຄໍລໍາທີສອງລາຍຊື່ລໍາດັບທີ່ສອດຄ້ອງກັນ
ຊື່ແທ້ຕາມທີ່ໄດ້ລະບຸໄວ້ໃນໄຟລ໌ການຈັດຮຽງລຳດັບຫຼາຍອັນ.

ຕົວຢ່າງຂອງໄຟລ໌ແຜນທີ່:

cytc1.pdb seq1
cytc2.pdb seq2
cytc3.pdb seq3

ໜ້າ ຈໍ OUTPUT


Theseus ໃຫ້ຜົນຜະລິດທີ່ອະທິບາຍເຖິງຄວາມຄືບຫນ້າຂອງ superposing ແລະຫຼາຍໆຢ່າງ
ສະຖິຕິຜົນສຸດທ້າຍ:

ຄລາສສິກ LS ຄູ່ :
RMSD ທໍາມະດາສໍາລັບ superposition, RMSD ສະເລ່ຍສໍາລັບຄູ່ທັງຫມົດ
ການປະສົມຂອງໂຄງສ້າງໃນກຸ່ມ.

ສີ່ຫຼ່ຽມນ້ອຍ :
ມາດຕະຖານ deviation ສໍາລັບ superposition, ອີງຕາມການສົມມຸດຕິຖານທໍາມະດາ
ບໍ່ມີຄວາມກ່ຽວຂ້ອງກັນ ແລະ ຄວາມແຕກຕ່າງທີ່ເທົ່າທຽມກັນ. ໂດຍພື້ນຖານແລ້ວເທົ່າກັບ RMSD ຈາກຄ່າສະເລ່ຍ
ໂຄງສ້າງ.

ສູງສຸດ ຄວາມເປັນໄປໄດ້ :
ການປຽບທຽບ ML ຂອງມາດຕະຖານ deviation ສໍາລັບ superposition. ເມື່ອສົມມຸດວ່າ
ຄວາມສຳພັນແມ່ນສູນ (a diagonal covariance matrix), ອັນນີ້ເທົ່າກັບ
ຮາກສີ່ຫຼ່ຽມຂອງຄ່າສະເລ່ຍປະສົມກົມກຽວຂອງຄວາມແຕກຕ່າງຂອງແຕ່ລະປະລໍາມະນູ. ໃນ​ທາງ​ກົງ​ກັນ​ຂ້າມ,
``ສີ່ຫຼ່ຽມນ້ອຍສຸດ '' ທີ່ໃຫ້ຂ້າງເທິງລາຍງານຮາກທີ່ສອງຂອງເລກເລກ
ຄ່າສະເລ່ຍຂອງຄວາມແຕກຕ່າງ. ຄ່າສະເລ່ຍປະສົມກົມກຽວແມ່ນໜ້ອຍກວ່າເລກຄະນິດສະເໝີ
ໂດຍສະເລ່ຍ, ແລະຄ່າສະເລ່ຍປະສົມກົມກຽວຫຼຸດລົງຄ່າໃຫຍ່ຕາມອັດຕາສ່ວນຂອງພວກມັນ
ຂະໜາດ. ນີ້ເຮັດໃຫ້ຄວາມຮູ້ສຶກທາງສະຖິຕິ, ເພາະວ່າເມື່ອລວມມູນຄ່າຫນຶ່ງຄວນ
ນ້ໍາຫນັກໃຫ້ເຂົາເຈົ້າໂດຍ reciprocal ຂອງຄວາມແຕກຕ່າງກັນຂອງເຂົາເຈົ້າ (ຊຶ່ງໃນຕົວຈິງແມ່ນສິ່ງທີ່ ML ໄດ້
ວິທີການ superposing ບໍ່).

ຂອບໃບ ຕົວເຊັນເຂົ້າ ຄວາມເປັນໄປໄດ້:
ຄວາມເປັນໄປໄດ້ຂອງບັນທຶກຂອບຂັ້ນສຸດທ້າຍຂອງ superposition, ສົມມຸດວ່າ matrix
ການແຜ່ກະຈາຍຂອງ Gaussian ຂອງໂຄງສ້າງ ແລະ gamma inverse hierarchical
ການແຈກຢາຍ eigenvalues ​​ຂອງ matrix covariance. ບັນທຶກຂອບ
ຄວາມເປັນໄປໄດ້ແມ່ນຄວາມເປັນໄປໄດ້ທີ່ມີ matrix covariance ປະສົມປະສານອອກ.

AIC: ເງື່ອນໄຂຂໍ້ມູນ Akaike ສໍາລັບ superposition ສຸດທ້າຍ. ນີ້ແມ່ນສິ່ງສໍາຄັນ
ສະຖິຕິໃນການວິເຄາະຄວາມເປັນໄປໄດ້ ແລະທິດສະດີການເລືອກຕົວແບບ. ມັນອະນຸຍາດໃຫ້ມີຈຸດປະສົງ
ການປຽບທຽບຂອງຕົວແບບທິດສະດີຫຼາຍຕົວທີ່ມີຕົວເລກທີ່ແຕກຕ່າງກັນຂອງຕົວກໍານົດການ. ໃນ
ໃນ​ກໍ​ລະ​ນີ​ນີ້​, ຈ​ໍ​າ​ນວນ​ທີ່​ສູງ​ທີ່​ດີກ​ວ່າ​. ມີການຊື້ຂາຍລະຫວ່າງເຫມາະກັບ
ຂໍ້ມູນແລະຈໍານວນຕົວກໍານົດການທີ່ເຫມາະສົມ. ການເພີ່ມຈໍານວນຕົວກໍານົດການ
ໃນແບບຈໍາລອງຈະສະເຫມີໃຫ້ເຫມາະກັບຂໍ້ມູນທີ່ດີກວ່າ, ແຕ່ມັນຍັງເພີ່ມຂຶ້ນ
ຄວາມບໍ່ແນ່ນອນຂອງມູນຄ່າຄາດຄະເນ. ເງື່ອນໄຂ AIC ຊອກຫາການປະສົມປະສານທີ່ດີທີ່ສຸດ
ໂດຍ (1) maximizing ເຫມາະກັບຂໍ້ມູນໃນຂະນະທີ່ (2) ຫຼຸດຜ່ອນຄວາມບໍ່ແນ່ນອນເນື່ອງຈາກ
ຈໍານວນຂອງຕົວກໍານົດການ. ໃນກໍລະນີ superposition, ຫນຶ່ງສາມາດປຽບທຽບຫນ້ອຍທີ່ສຸດ
superposition ຮຽບຮ້ອຍເປັນ superposition ຄວາມເປັນໄປໄດ້ສູງສຸດ. ວິທີການ (ຫຼື
ຮູບແບບ) ທີ່ມີ AIC ສູງກວ່າແມ່ນມັກ. ຄວາມແຕກຕ່າງໃນ AIC ຂອງ 2 ຫຼືຫຼາຍກວ່ານັ້ນແມ່ນ
ພິຈາລະນາຫຼັກຖານສະຖິຕິທີ່ເຂັ້ມແຂງສໍາລັບຮູບແບບທີ່ດີກວ່າ.

BIC: ເກນຂໍ້ມູນ Bayesian. ຄ້າຍຄືກັນກັບ AIC, ແຕ່ມີ Bayesian
ເນັ້ນໜັກ.

Omnibus chi2:
ສະຖິຕິ chi2 ຫຼຸດລົງໂດຍລວມສໍາລັບການສອດຄ່ອງທັງຫມົດ, ລວມທັງການຫມຸນ,
ການແປ, ຄວາມແຕກຕ່າງກັນ, ແລະຕົວກໍານົດການ inverse gamma. ນີ້ອາດຈະເປັນ
ສະຖິຕິທີ່ສໍາຄັນທີ່ສຸດສໍາລັບ superposition ໄດ້. ໃນບາງກໍລະນີ, gamma ປີ້ນກັບກັນ
ພໍດີອາດຈະບໍ່ດີ, ແຕ່ພໍດີໂດຍລວມຍັງດີຫຼາຍ. ອີກເທື່ອຫນຶ່ງ, ມັນຄວນຈະເປັນທີ່ເຫມາະສົມ
ຢູ່ໃກ້ກັບ 1.0, ເຊິ່ງຈະຊີ້ໃຫ້ເຫັນເຖິງຄວາມເຫມາະສົມທີ່ສົມບູນແບບ. ຢ່າງໃດກໍຕາມ, ຖ້າທ່ານຄິດວ່າມັນແມ່ນ
ໃຫຍ່ເກີນໄປ, ໃຫ້ແນ່ໃຈວ່າສົມທຽບມັນກັບ chi2 ສໍາລັບສີ່ຫຼ່ຽມນ້ອຍທີ່ສຸດພໍດີ; ມັນ
ອາດຈະບໍ່ດີປານໃດຫຼັງຈາກທັງຫມົດ. chi2 ຂະຫນາດໃຫຍ່ມັກຈະຊີ້ໃຫ້ເຫັນເຖິງການລະເມີດ
ສົມມຸດຕິຖານຂອງຕົວແບບ. ການລະເມີດທົ່ວໄປທີ່ສຸດແມ່ນເມື່ອ superposing ສອງຫຼື
ໂດເມນເອກະລາດຫຼາຍທີ່ສາມາດ rotate ທຽບກັບກັນແລະກັນ. ຖ້ານີ້ແມ່ນ
ກໍ​ລະ​ນີ, ຫຼັງ​ຈາກ​ນັ້ນ​ອາດ​ຈະ​ມີ​ບໍ່​ພຽງ​ແຕ່​ການ​ແຜ່​ກະ​ຈາຍ Gaussian ຫນຶ່ງ​, ແຕ່​ຈໍາ​ນວນ​ຫນຶ່ງ​
Gaussians ປະສົມ, ຫນຶ່ງສໍາລັບແຕ່ລະໂດເມນ. ຫຼັງຈາກນັ້ນ, ມັນຈະເປັນການດີກວ່າທີ່ຈະ superpose ແຕ່ລະຄົນ
ໂດເມນເປັນເອກະລາດ.

ລຳ ດັບຊັ້ນ var (ອັນຟາ, ແກມມາ) chi2:
chi2 ທີ່ຫຼຸດລົງສໍາລັບຄວາມພໍດີຂອງແກມມາແບບປີ້ນກັນຂອງ eigenvalues ​​matrix covariance. ເປັນ
ກ່ອນຫນ້ານີ້, ມັນຄວນຈະເປັນທີ່ເຫມາະສົມກັບ 1.0. ສອງຄ່າໃນວົງເລັບແມ່ນ
ML ການ​ຄາດ​ຄະ​ເນ​ຂອງ​ຂະ​ຫນາດ​ແລະ​ຕົວ​ກໍາ​ນົດ​ຮູບ​ຮ່າງ​, ຕາມ​ລໍາ​ດັບ​, ສໍາ​ລັບ​ການ inverse ໄດ້​
ການແຜ່ກະຈາຍ gamma.

ພືດຫມູນວຽນ, ການ​ແປ​ພາ​ສາ​, ໂຄວາ chi2:
ສະຖິຕິ chi2 ຫຼຸດລົງສໍາລັບຄວາມສອດຄ່ອງຂອງໂຄງສ້າງກັບຕົວແບບ. ດ້ວຍດີ
ພໍດີມັນຄວນຈະຢູ່ໃກ້ກັບ 1.0, ເຊິ່ງຊີ້ໃຫ້ເຫັນເຖິງຄວາມສອດຄ່ອງທີ່ສົມບູນແບບຂອງຂໍ້ມູນ
ຕົວແບບສະຖິຕິ. ໃນກໍລະນີຂອງສີ່ຫຼ່ຽມນ້ອຍທີ່ສຸດ, ຮູບແບບສົມມຸດຕິຖານແມ່ນ matrix
ການແຜ່ກະຈາຍຂອງ Gaussian ຂອງໂຄງສ້າງທີ່ມີຄວາມແຕກຕ່າງກັນເທົ່າທຽມກັນແລະບໍ່ມີການພົວພັນກັນ.
ສໍາລັບ ML ເຫມາະ, ແບບສົມມຸດຕິຖານແມ່ນຄວາມແຕກຕ່າງທີ່ບໍ່ເທົ່າທຽມກັນແລະບໍ່ມີການພົວພັນກັນ, ຍ້ອນວ່າ.
ຄິດໄລ່ດ້ວຍ -v ທາງເລືອກ [ຄ່າເລີ່ມຕົ້ນ]. ສະຖິຕິນີ້ແມ່ນສໍາລັບ superposition
ເທົ່ານັ້ນ, ແລະບໍ່ລວມເຖິງຄວາມເໝາະສົມຂອງຄ່າຂອງຄູ່ຄວາມຜັນຜວນ matrix eigenvalues ​​ກັບ an
ການແຈກຢາຍແກມມາປີ້ນກັບກັນ. ເບິ່ງ ``Omnibus chi2'' ຂ້າງລຸ່ມນີ້.

ລຳ ດັບຊັ້ນ ຕໍາ່ສຸດທີ່ ມີ:
ຄວາມເໝາະສົມຕາມລຳດັບຂອງການແຈກຢາຍແກມມາແບບປີ້ນກັນຈຳກັດຄວາມແປປວນຂອງ
ປະລໍາມະນູໂດຍການເຮັດໃຫ້ຂະຫນາດໃຫຍ່ຂະຫນາດນ້ອຍກວ່າແລະຂະຫນາດນ້ອຍຂະຫນາດໃຫຍ່. ສະຖິຕິນີ້
ລາຍງານຄວາມຜັນຜວນທີ່ເປັນໄປໄດ້ຕໍ່າສຸດທີ່ໃຫ້ຄ່າ inverse gamma parameters.

ຄວາມ​ອ່ອນ​ໂຍນ​, skewness Z-value, kurtosis & kurtosis Z-value:
skewness ແລະ kurtosis ຂອງ residuals ໄດ້. ທັງສອງຄວນຈະເປັນ 0.0 ຖ້າສານຕົກຄ້າງພໍດີ
ການແຜ່ກະຈາຍ Gaussian ຢ່າງສົມບູນ. ພວກເຂົາເຈົ້າແມ່ນປະຕິບັດຕາມໂດຍ P-value ສໍາລັບ
ສະຖິຕິ. ນີ້ແມ່ນການທົດສອບທີ່ເຂັ້ມງວດຫຼາຍ; residuals ສາມາດຫຼາຍທີ່ບໍ່ແມ່ນ Gaussian ແລະ
ຢ່າງໃດກໍຕາມ, ການຫມຸນ, ການແປ, ແລະ matrix sibariance ຄາດຄະເນອາດຈະຍັງຄົງຢູ່
ຖືກຕ້ອງຫຼາຍ.

ຂໍ້ມູນ ຄະແນນ, Free params, D/P:
ຈໍາ​ນວນ​ທັງ​ຫມົດ​ຂອງ​ຂໍ້​ມູນ​ທີ່​ໄດ້​ຮັບ​ການ​ສັງ​ເກດ​ໂຄງ​ສ້າງ​ທັງ​ຫມົດ​, ຈໍາ​ນວນ​ຂອງ​
ຕົວກໍານົດການທີ່ເຫມາະສົມກັບຕົວແບບ, ແລະອັດຕາສ່ວນຂໍ້ມູນຕໍ່ພາລາມິເຕີ.

Median ໂຄງສ້າງ:
ໂຄງປະກອບການໂດຍລວມແມ່ນຄ້າຍຄືກັນກັບໂຄງສ້າງສະເລ່ຍ. ນີ້ສາມາດເປັນ
ຖືວ່າເປັນໂຄງສ້າງ 'ປົກກະຕິ' ທີ່ສຸດໃນກຸ່ມ.

ທັງຫມົດ ຮອບ:
ຈໍາ​ນວນ​ຂອງ​ການ​ເຮັດ​ຊ້ຳ​ທີ່​ວິ​ທີ​ການ​ໄດ້​ເອົາ​ມາ​ເຂົ້າ​ກັນ.

ແຕ່ສ່ວນຫນຶ່ງ ຄວາມຊັດເຈນ:
ຄວາມແມ່ນຍໍາທີ່ແທ້ຈິງທີ່ algorithm converged ກັບ.

OUTPUT ເອກະສານ


Theseus ຂຽນອອກໄຟລ໌ຕໍ່ໄປນີ້:

theseus_sup.pdb
superposition ສຸດທ້າຍ, rotated ກັບແກນຫຼັກການຂອງໂຄງສ້າງສະເລ່ຍ.

theseus_ave.pdb
ການຄາດຄະເນຂອງໂຄງສ້າງສະເລ່ຍ.

theseus_residuals.txt
ການຕົກຄ້າງປົກກະຕິຂອງ superposition. ເຫຼົ່ານີ້ສາມາດໄດ້ຮັບການວິເຄາະສໍາລັບການ deviations
ຈາກປົກກະຕິ (ບໍ່ວ່າພວກມັນເຫມາະສົມກັບການແຈກຢາຍ Gaussian ມາດຕະຖານ). ເຊັ່ນ: chi2,
skewness, ແລະສະຖິຕິ kurtosis ແມ່ນອີງໃສ່ຄຸນຄ່າເຫຼົ່ານີ້.

theseus_transf.txt
matrices ພືດຫມູນວຽນການຫັນເປັນສຸດທ້າຍແລະ vectors ການແປພາສາ.

theseus_variances.txt
vector ຂອງຄວາມແຕກຕ່າງທີ່ຄາດຄະເນສໍາລັບແຕ່ລະປະລໍາມະນູ.

ເມື່ອອົງປະກອບຫຼັກຖືກຄິດໄລ່ (ກັບ -P option), ໄຟລ໌ຕໍ່ໄປນີ້ແມ່ນ
ຍັງ​ຜະ​ລິດ​:

theseus_pcvecs.txt
vectors ອົງປະກອບຕົ້ນຕໍ.

theseus_pcstats.txt
ສະ​ຖິ​ຕິ​ທີ່​ງ່າຍ​ດາຍ​ສໍາ​ລັບ​ແຕ່​ລະ​ອົງ​ປະ​ກອບ​ຫຼັກ​ການ (ການ​ໂຫຼດ​, ຄວາມ​ແຕກ​ຕ່າງ​ອະ​ທິ​ບາຍ​,
ແລະອື່ນໆ).

theseus_pcN_ave.pdb
ໂຄງສ້າງສະເລ່ຍທີ່ມີອົງປະກອບຫຼັກ Nth ຂຽນໃນອຸນຫະພູມ
ພາກສະຫນາມປັດໄຈ.

theseus_pcN.pdb
superposition ສຸດທ້າຍທີ່ມີອົງປະກອບຕົ້ນຕໍ Nth ຂຽນໃນອຸນຫະພູມ
ພາກສະຫນາມປັດໄຈ. ໄຟລ໌ນີ້ຈະຖືກລະເວັ້ນເມື່ອ superposing ໂມເລກຸນທີ່ມີຄວາມແຕກຕ່າງ
ລໍາດັບ residue (mode 2).

theseus_cor.mat, theseus_cov.mat
ມາຕຣິກເບື້ອງຄວາມສຳພັນປະລໍາມະນູ ແລະ matrices covariance, ອີງໃສ່ຂັ້ນສຸດທ້າຍ
superposition. ຮູບແບບແມ່ນເຫມາະສົມສໍາລັບການປ້ອນຂໍ້ມູນໃສ່ GNU's octave. ເຫຼົ່ານີ້ແມ່ນ
matrices ທີ່ໃຊ້ໃນການວິເຄາະອົງປະກອບຫຼັກ.

ໃຊ້ theseus ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net


ເຊີບເວີ ແລະສະຖານີເຮັດວຽກຟຣີ

ດາວໂຫຼດແອັບ Windows ແລະ Linux

Linux ຄຳ ສັ່ງ

Ad




×
ການ​ໂຄ​ສະ​ນາ
?ຊື້ເຄື່ອງ, ຈອງ, ຫຼືຊື້ທີ່ນີ້ — ບໍ່ມີຄ່າໃຊ້ຈ່າຍ, ຊ່ວຍໃຫ້ການບໍລິການຟຣີ.