ນີ້ແມ່ນຄໍາສັ່ງ map2slimp ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
map2slim - ແຜນທີ່ສະມາຄົມພັນທຸກໍາໄປສູ່ ontology 'ກະທັດຮັດ'
ສະຫຼຸບສັງລວມ
cd ໄປ
map2slim GO_slims/goslim_generic.obo ontology/gene_ontology.obo gene-associations/gene_association.fb
ລາຍລະອຽດ
ໃຫ້ໄຟລ໌ GO slim, ແລະ ontology ປະຈຸບັນ (ໃນຫນຶ່ງຫຼືຫຼາຍໄຟລ໌), script ນີ້ຈະແຜນທີ່.
ໄຟລ໌ສະມາຄົມພັນທຸກໍາ (ປະກອບດ້ວຍຄໍາບັນຍາຍກ່ຽວກັບ GO ສະບັບເຕັມ) ກັບຂໍ້ກໍານົດໃນ GO
ບາງ.
ສະຄຣິບສາມາດໃຊ້ເພື່ອສ້າງໄຟລ໌ສະມາຄົມພັນທຸກໍາອັນໃໝ່, ເຊິ່ງປະກອບມີຫຼາຍສຸດ
GO slim accessions ທີ່ກ່ຽວຂ້ອງ, ຫຼືໃນໂຫມດນັບ, ໃນກໍລະນີນີ້ມັນຈະໃຫ້ gene ທີ່ແຕກຕ່າງກັນ.
ການນັບຜະລິດຕະພັນສໍາລັບແຕ່ລະໄລຍະບາງໆ
ຮູບແບບເອກະສານສະມາຄົມໄດ້ຖືກອະທິບາຍຢູ່ທີ່ນີ້:
<http://www.geneontology.org/GO.annotation.shtml#ໄຟລ໌>
ການໂຕ້ຖຽງ
-b ຖັງ ກະທັດຮັດ ເອກະສານ
ການໂຕ້ຖຽງນີ້ເພີ່ມ ຖັງ ຂໍ້ກໍານົດ ກັບ ontology ກະທັດຮັດ; ເບິ່ງເອກະສານຂ້າງລຸ່ມນີ້ສໍາລັບ
ຄໍາອະທິບາຍ. ໄຟລ໌ ontology ທີ່ອ່ອນໂຍນໃຫມ່, ລວມທັງຂໍ້ກໍານົດ bucket ຈະຖືກຂຽນເຖິງ
ຖັງ ກະທັດຮັດ ເອກະສານ
- ແຜນທີ່ ກະທັດຮັດ ແຜນທີ່ ເອກະສານ
ນີ້ຈະສ້າງໄຟລ໌ແຜນທີ່ສໍາລັບທຸກໆຄໍາສັບໃນ ontology ເຕັມທີ່ສະແດງໃຫ້ເຫັນທັງສອງ
ຄຳສັບທີ່ມີຄວາມກະທັດຮັດທີ່ກ່ຽວຂ້ອງທີ່ສຸດ ແລະທຸກຄຳທີ່ກະທັດຮັດທີ່ເປັນບັນພະບຸລຸດ. ຖ້າທ່ານໃຊ້ນີ້
ທາງເລືອກ, ຢ່າສະຫນອງໄຟລ໌ພັນທຸກໍາ
ຊື່ສະແດງ
(ໃຊ້ໄດ້ກັບ -outmap ເທົ່ານັ້ນ)
ສະແດງຊື່ຂອງຄຳສັບໃນໄຟລ໌ແຜນທີ່ແບບກະທັດຮັດ
-c ນີ້ຈະບັງຄັບໃຫ້ map2slim ໃຫ້ການນັບຂອງໄຟລ໌ assoc, ແທນທີ່ຈະເປັນແຜນທີ່ມັນ
-t ເມື່ອໃຊ້ຮ່ວມກັບ -c ຈະແຖບຜົນຜະລິດເພື່ອໃຫ້ indentation ສະທ້ອນໃຫ້ເຫັນ
ລຳດັບຕົ້ນໄມ້ຢູ່ໃນໄຟລ໌ກະທັດຮັດ
-o ອອກ ເອກະສານ
ນີ້ຈະຂຽນ assocs ແຜນທີ່ (ຫຼືນັບ) ໃສ່ໄຟລ໌ທີ່ລະບຸ, ແທນທີ່ຈະ
ຫນ້າຈໍ
DOWNLOAD
script ນີ້ແມ່ນສ່ວນຫນຶ່ງຂອງ go-perl ຊຸດ, ມີໃຫ້ຈາກ CPAN
<http://search.cpan.org/~cmungall/go-perl/>
ສະຄຣິບນີ້ຈະບໍ່ເຮັດວຽກໂດຍບໍ່ມີການຕິດຕັ້ງ go-perl
MAPPING ອັລເກີຣິດ
GO ແມ່ນ DAG, ບໍ່ແມ່ນຕົ້ນໄມ້. ນີ້ຫມາຍຄວາມວ່າມັກຈະມີຫຼາຍກວ່າຫນຶ່ງເສັ້ນທາງຈາກຄໍາສັບ GO
ເຖິງຮາກ Gene_Ontology node; ເສັ້ນທາງອາດຈະຕັດກັນຫຼາຍຄໍາສັບໃນບາງໆ
ontology - ຊຶ່ງຫມາຍຄວາມວ່າຫນຶ່ງຄໍາບັນຍາຍສາມາດສ້າງແຜນທີ່ກັບຫຼາຍຄໍາສັບຕ່າງໆ!
(ຫມາຍເຫດ ທ່ານຕ້ອງການເບິ່ງນີ້ອອນໄລນ໌ເພື່ອເບິ່ງຮູບພາບຂ້າງລຸ່ມນີ້ - ຖ້າຫາກວ່າທ່ານບໍ່ໄດ້ເບິ່ງນີ້ຢູ່ໃນ
ໄດ້ http://www.geneontology.org ເວັບໄຊທ໌, ທ່ານສາມາດເບິ່ງ URL ຕໍ່ໄປນີ້:
<http://geneontology.cvs.sourceforge.net/*ເຊັກເອົາ*/geneontology/go-dev/go-perl/doc/map2slim.gif>
)
ຕົວຢ່າງທີ່ສົມມຸດຕິຖານວົງສີຟ້າສະແດງໃຫ້ເຫັນຄໍາສັບໃນ GO slim, ແລະວົງສີເຫຼືອງສະແດງໃຫ້ເຫັນ
ຂໍ້ກໍານົດໃນ ontology ເຕັມ. ontology ເຕັມ subsumes slim, ສະນັ້ນຂໍ້ກໍານົດສີຟ້າແມ່ນ
ໃນ ontology ໄດ້.
ໄປທີ່ແຜນທີ່ ID ເພື່ອສະລິມ ID ບັນພະບຸລຸດກະທັດຮັດທັງຫມົດ
===== =============== ==================
5 2+3 2,3,1
6 3 ພຽງແຕ່ 3,1
7 4 ພຽງແຕ່ 4,3,1
8 3 ພຽງແຕ່ 3,1
9 4 ພຽງແຕ່ 4,3,1
10 2+3 2,3,1
ຖັນທີ 2 ສະແດງໃຫ້ເຫັນ ID (s) ທີ່ກ່ຽວຂ້ອງທີ່ສຸດຢູ່ໃນແຜນທີ່ໂດຍກົງເລັກນ້ອຍ. ທີ 3
ຖັນສະແດງໃຫ້ເຫັນບັນພະບຸລຸດທັງຫມົດໃນກະທັດຮັດ.
ຫມາຍເຫດໂດຍສະເພາະການສ້າງແຜນທີ່ ID 9 ເຖິງແມ່ນວ່ານີ້ມີສອງເສັ້ນທາງໄປຫາຮາກ
ເສັ້ນກະທັດຮັດຜ່ານ 3 ແລະ 4, 3 ຖືກຍົກເລີກເນື່ອງຈາກວ່າມັນຖືກຍ່ອຍດ້ວຍ 4.
ໃນທາງກົງກັນຂ້າມ, ແຜນທີ່ 10 ໄປຫາທັງ 2 ແລະ 3 ເພາະວ່າເຫຼົ່ານີ້ແມ່ນທັງສອງ ID ເລັກນ້ອຍທໍາອິດໃນ.
ສອງເສັ້ນທາງທີ່ຖືກຕ້ອງໄປຫາຮາກ, ແລະທັງສອງບໍ່ຍ່ອຍອີກ.
ສູດການຄິດໄລ່ທີ່ໃຊ້ແມ່ນ:
ເພື່ອສ້າງແຜນທີ່ອັນໃດນຶ່ງໃນ ontology ເຕັມ: ຊອກຫາເສັ້ນທາງທີ່ຖືກຕ້ອງທັງຫມົດໄປຫາຂໍ້ຮາກໃນ
ontology ເຕັມ
ສໍາລັບແຕ່ລະເສັ້ນທາງ, ເອົາໄລຍະທໍາອິດທີ່ພົບໃນເສັ້ນທາງ
ຍົກເລີກຂໍ້ກໍານົດບາງໆທີ່ຊໍ້າຊ້ອນຢູ່ໃນຊຸດນີ້ ເຊັ່ນ: ຂໍ້ກໍານົດບາງໆທີ່ຍ່ອຍດ້ວຍຂໍ້ກໍານົດບາງໆອື່ນໆ.
ໃນຊຸດ
ຄຸ ຂໍ້ກໍານົດ
ຖ້າທ່ານແລ່ນສະຄຣິບດ້ວຍຕົວເລືອກ -b, ຂໍ້ກໍານົດ bucket ຈະຖືກເພີ່ມ. ສໍາລັບຄໍາສັບ P in
ກະທັດຮັດ, ຖ້າ P ມີຢ່າງຫນ້ອຍຫນຶ່ງລູກ C, bucket term P' ຈະຖືກສ້າງຂື້ນພາຍໃຕ້ P. ນີ້ແມ່ນ.
ຄຳ ສັບທີ່ຈັບໄດ້ທັງ ໝົດ ສຳ ລັບການສ້າງແຜນທີ່ ຄຳ ສັບໃດ ໜຶ່ງ ໃນ ontology ເຕັມທີ່ແມ່ນລູກຫລານຂອງ P, ແຕ່.
ບໍ່ແມ່ນລູກຫລານຂອງເດັກນ້ອຍ P ໃນ ontology ກະທັດຮັດ.
ຕົວຢ່າງ, generic.0208 slim ມີຂໍ້ກໍານົດ ແລະໂຄງສ້າງຕໍ່ໄປນີ້:
% ການຜູກມັດ DNA ; GO:0003677
% ການຜູກມັດ chromatin ; GO:0003682
% ກິດຈະກໍາປັດໄຈ transcription ; GO:0003700, GO:0000130
ຫຼັງຈາກເພີ່ມຂໍ້ກໍານົດ bucket, ມັນຈະເບິ່ງຄືວ່ານີ້:
% ການຜູກມັດ DNA ; GO:0003677
% ການຜູກມັດ chromatin ; GO:0003682
% ກິດຈະກໍາປັດໄຈ transcription ; GO: 0003700 ; ຄໍາສັບຄ້າຍຄື:GO:0000130
@bucket:Z-OTHER-ການຜູກມັດ DNA ; slim_temp_id:12
ຂໍ້ກໍານົດຈາກ ontology ເຕັມທີ່ແມ່ນເດັກນ້ອຍອື່ນໆຂອງການຜູກມັດ DNA, ເຊັ່ນດຽວ -.
ການຜູກມັດ DNA ທີ່ຖືກຜູກມັດແລະລູກຫລານຂອງມັນຈະເຮັດແຜນທີ່ກັບໄລຍະ bucket.
bucket term ມີ ID ແບບກະທັດຮັດເຊິ່ງເປັນ transient ແລະມີພຽງແຕ່ເພື່ອອໍານວຍຄວາມສະດວກ
ແຜນທີ່. ມັນບໍ່ຄວນຖືກນໍາໃຊ້ພາຍນອກ.
ຄຳສັບ bucket ມີຄຳນຳໜ້າ Z-OTHER; Z ແມ່ນການ hack ເພື່ອເຮັດໃຫ້ແນ່ໃຈວ່າຄໍາສັບແມ່ນ
ລະບຸໄວ້ສະເໝີໃນການຈັດລຳດັບຕົວໜັງສື.
ສູດການຄິດໄລ່ຖືກດັດແກ້ເລັກນ້ອຍຖ້າໃຊ້ຂໍ້ກໍານົດ bucket. ໄລຍະ bucket ມີ
ຄວາມສຳພັນອັນເປັນຈິງກັບອ້າຍເອື້ອຍນ້ອງທັງໝົດບໍ່ແມ່ນຢູ່ໃນແບບບາງໆ.
Do I ຕ້ອງການ ຖັງ ເງື່ອນໄຂ?
ໃນປັດຈຸບັນໄຟລ໌ທີ່ອ່ອນເພຍສ່ວນຫຼາຍແມ່ນ 'ສົມບູນ' ທັງຫມົດ, ນັ້ນແມ່ນບໍ່ມີຊ່ອງຫວ່າງ.
ນີ້ຫມາຍຄວາມວ່າທາງເລືອກ -b ຈະບໍ່ສ້າງຜົນໄດ້ຮັບທີ່ແຕກຕ່າງກັນທີ່ສັງເກດເຫັນ. ຍົກຕົວຢ່າງ,
ເຈົ້າອາດຈະເຫັນຄຳສັບ bucket ອື່ນທີ່ສ້າງຂື້ນມາ, ໂດຍບໍ່ມີຫຍັງໝາຍເຖິງມັນ: ເພາະວ່າທັງໝົດ
ເດັກນ້ອຍຂອງການຜູກມັດໃນ GO ແມ່ນເປັນຕົວແທນຢູ່ໃນໄຟລ໌ທີ່ກະທັດຮັດ.
ຕົວເລືອກ bucket ແມ່ນມີຄວາມຈໍາເປັນແທ້ໆສໍາລັບບາງໄຟລ໌ບາງໆທີ່ເກັບໄວ້ເກົ່າ,
ເຊິ່ງແມ່ນ static ແລະຖືກສ້າງຂື້ນໃນທາງທີ່ຂ້ອນຂ້າງ; ພວກເຂົາເຈົ້າມີແນວໂນ້ມທີ່ຈະສະສົມ "ຊ່ອງຫວ່າງ"
ເມື່ອເວລາຜ່ານໄປ (ເຊັ່ນ: GO ຈະເພີ່ມການຜູກມັດລູກໃໝ່, ແຕ່ໄຟລ໌ບາງເບົາຄົງທີ່ຈະບໍ່ຂຶ້ນກັບ.
ວັນທີ, ດັ່ງນັ້ນຜະລິດຕະພັນ gene ໃດໆທີ່ລະບຸໄວ້ໃນຄໍາສັບໃຫມ່ນີ້ຈະແຜນທີ່ກັບ OTHER-binding ໃນ
ບາງ)
GRAPH ຄວາມຜິດພາດ
ກະລຸນາຮັບຊາບວ່າໄຟລ໌ ontology ເລັກນ້ອຍອາດຈະລ້າສະໄຫມກ່ຽວກັບປັດຈຸບັນ
ontology.
ໃນປັດຈຸບັນ map2slim ບໍ່ໄດ້ລາຍງານກາຟທີ່ບໍ່ກົງກັນລະຫວ່າງກຣາຟບາງໆ ແລະກຣາຟໃນ
ໄຟລ໌ ontology ເຕັມ; ມັນໃຊ້ເວລາ ontology ເຕັມທີ່ວ່າເປັນເສັ້ນສະແດງທີ່ແທ້ຈິງ. ຢ່າງໃດກໍຕາມ, ໄດ້
ontology ກະທັດຮັດຈະຖືກນໍາໃຊ້ເພື່ອຈັດຮູບແບບຜົນໄດ້ຮັບຖ້າທ່ານເລືອກ -t -c ເປັນທາງເລືອກ.
OUTPUT
ໃນຮູບແບບປົກກະຕິ, ໄຟລ໌ການເຊື່ອມໂຍງ gene-ຮູບແບບມາດຕະຖານຈະຖືກຂຽນ. ຖັນ GO ID
(5) ຈະມີ GO slim IDs. ແຜນທີ່ກົງກັບຖັນທີ 2 ໃນຕາຕະລາງ
ຂ້າງເທິງ. ໃຫ້ສັງເກດວ່າໄຟລ໌ຜົນຜະລິດອາດມີເສັ້ນເພີ່ມເຕີມທີ່ໄຟລ໌ປ້ອນຂໍ້ມູນ. ນີ້ແມ່ນ
ເນື່ອງຈາກວ່າບາງ ID GO ເຕັມມີຫຼາຍກວ່າຫນຶ່ງ ID ທີ່ມີຄວາມກະທັດຮັດທີ່ກ່ຽວຂ້ອງ.
ນັບ MODE
map2slim ສາມາດດໍາເນີນການດ້ວຍຕົວເລືອກ -c, ເຊິ່ງຈະເຮັດໃຫ້ການນັບຂອງ gene ທີ່ແຕກຕ່າງກັນ
ຜະລິດຕະພັນທີ່ມີແຜນທີ່ໃສ່ແຕ່ລະໄລຍະບາງໆ. ຖັນມີດັ່ງນີ້
GO Term
ຖັນທໍາອິດແມ່ນ GO ID ຕິດຕາມດ້ວຍຊື່ຄໍາສັບ (ຊື່ຄໍາສັບແມ່ນສະຫນອງໃຫ້ເປັນ
ມັນໄດ້ຖືກພົບເຫັນຢູ່ໃນທັງ GO ເຕັມແລະ ontologies slim - ເຫຼົ່ານີ້ປົກກະຕິແລ້ວຈະຄືກັນ
ແຕ່ບາງຄັ້ງໄຟລ໌ບາງໆຈະຊັກຊ້າການປ່ຽນແປງໃນໄຟລ໌ GO)
ການນັບຂອງຜະລິດຕະພັນ gene ທີ່ນີ້ແມ່ນຄໍາທີ່ມີຄວາມກະທັດຮັດທີ່ກ່ຽວຂ້ອງທີ່ສຸດ
ຈໍານວນຂອງຜະລິດຕະພັນ gene ທີ່ແຕກຕ່າງກັນສໍາລັບການນີ້ແມ່ນທີ່ກ່ຽວຂ້ອງທີ່ສຸດ / ກະທັດຮັດໂດຍກົງ
ID. ໂດຍສ່ວນໃຫຍ່ພວກເຮົາຫມາຍຄວາມວ່າສະມາຄົມແມ່ນເຮັດໂດຍກົງກັບຄໍານີ້,
ຫຼື ສະມາຄົມແມ່ນສ້າງຂື້ນກັບເດັກນ້ອຍທີ່ມີລັກສະນະກະທັດຮັດນີ້ ແລະບໍ່ມີເດັກນ້ອຍທີ່ກະທັດຮັດ
ໄລຍະທີ່ສະມາຄົມວາງແຜນໄວ້.
ສໍາລັບຜູ້ກະທັດຮັດສ່ວນໃຫຍ່, ການນັບນີ້ຈະເທົ່າກັບຈໍານວນຂອງສະມາຄົມໂດຍກົງ
ແຜນທີ່ເປັນໄລຍະທີ່ກະທັດຮັດນີ້. ຢ່າງໃດກໍຕາມ, ບາງໄຟລ໌ທີ່ອ່ອນເພຍເກົ່າແມ່ນ "spotty" ໃນນັ້ນພວກມັນ
ຍອມຮັບ "ຊ່ອງຫວ່າງ". ສໍາລັບການຍົກຕົວຢ່າງ, ຖ້າຫາກວ່າກະທັດຮັດມີເດັກນ້ອຍທັງຫມົດຂອງ "ຂະບວນການທາງຊີວະພາບ" ກັບ
ຂໍ້ຍົກເວັ້ນຂອງ "ພຶດຕິກໍາ" ຫຼັງຈາກນັ້ນທຸກຄໍາບັນຍາຍຕໍ່ກັບ "ພຶດຕິກໍາ" ຫຼືເດັກນ້ອຍຂອງມັນຈະເປັນ
ນັບຢູ່ທີ່ນີ້
ເບິ່ງຕົວຢ່າງຂ້າງລຸ່ມນີ້
ຈຳນວນຜະລິດຕະພັນພັນທຸກໍາທີ່ສົມມຸດວ່າມີຄວາມກ່ຽວພັນກັບໄລຍະກະທັດຮັດ
ແລະຈໍານວນຂອງຜະລິດຕະພັນ gene ທີ່ແຕກຕ່າງກັນ, ເຊິ່ງໄດ້ອະທິບາຍເຖິງລູກຫລານຂອງເລື່ອງນີ້
ໄອດີກະທັດຮັດ (ຫຼືໝາຍເຫດໂດຍກົງໃສ່ລະຫັດກະທັດຮັດ).
ທຸງຍົກເລີກ
ໄປ ontology
ເອົາຕົວຢ່າງ; ຖ້າພວກເຮົາໃຊ້ -t ແລະ -c ແບບນີ້:
map2slim -t -c GO_slims/goslim_generic.obo ontology/gene_ontology.obo gene-associations/gene_association.fb
ຫຼັງຈາກນັ້ນ, ບາງສ່ວນຂອງຜົນໄດ້ຮັບອາດຈະເບິ່ງຄືວ່ານີ້:
GO:0008150 biological_process (biological_process) 34 10025 biological_process
GO:0007610 ພຶດຕິກຳ (behavior) 632 632 biological_process
GO:0000004 ຂະບວນການທາງຊີວະວິທະຍາທີ່ບໍ່ຮູ້ຈັກ (ບໍ່ຮູ້ຈັກຂະບວນການທາງຊີວະພາບ) 832 832 biological_process
GO:0007154 ການສື່ສານຜ່ານມືຖື (cell communication) 333 1701 biological_process
GO:0008037 ການຈຳແນກເຊນ (ການຮັບຮູ້ເຊລ) 19 19 ຂະບວນການທາງຊີວະພາບ
19 ຜະລິດຕະພັນໄດ້ຖືກສ້າງແຜນທີ່ໄປທີ່ GO:0008037 ຫຼືຫນຶ່ງໃນລູກຂອງມັນ. (GO:0008037 ແມ່ນຂໍ້ຕໍ່ໃບໃນກະທັດຮັດ, ດັ່ງນັ້ນການນັບທັງສອງແມ່ນຄືກັນ).
ໃນທາງກົງກັນຂ້າມ, GO: 0008150 ໄດ້ຮັບພຽງແຕ່ 34 ຜະລິດຕະພັນ, ເຊິ່ງນີ້ແມ່ນຄວາມກ່ຽວຂ້ອງທີ່ສຸດ.
ໄລຍະ. ນີ້ແມ່ນຍ້ອນວ່າຄໍາບັນຍາຍສ່ວນໃຫຍ່ຈະແຜນທີ່ກັບເດັກນ້ອຍບາງຄົນຂອງ GO:0008150 ໃນແບບກະທັດຮັດ,
ເຊັ່ນ GO:0007610 (ພຶດຕິກໍາ). ຜະລິດຕະພັນ 34 gene ເຫຼົ່ານີ້ແມ່ນໄດ້ອະທິບາຍໂດຍກົງກັບ
GO:0008150, ຫຼືສໍາລັບເດັກນ້ອຍບາງຄົນຂອງຄໍາສັບນີ້ທີ່ບໍ່ຢູ່ໃນກະທັດຮັດ. ນີ້ສາມາດຊີ້ໃຫ້ເຫັນ
'ຊ່ອງຫວ່າງ' ໃນກະທັດຮັດ. ໃຫ້ສັງເກດວ່າການແລ່ນ map2slim ດ້ວຍຕົວເລືອກ -b ຈະ 'ສຽບ' ຊ່ອງຫວ່າງເຫຼົ່ານີ້
ກັບຂໍ້ກໍານົດ filler ປອມ.
ໃຊ້ map2slimp ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net