ນີ້ແມ່ນແອັບ Linux ທີ່ມີຊື່ວ່າ TXM ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ໃນນາມ PreparationetImportdansTXM2019.zip. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີເຮັດວຽກ.
ດາວນ໌ໂຫລດແລະດໍາເນີນການອອນໄລນ໌ app ນີ້ຊື່ TXM ກັບ OnWorks ໄດ້ຟຣີ.
ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:
- 1. ດາວໂຫຼດຄໍາຮ້ອງສະຫມັກນີ້ໃນ PC ຂອງທ່ານ.
- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.
- 4. ເລີ່ມ OnWorks Linux ອອນລາຍ ຫຼື Windows online emulator ຫຼື MACOS online emulator ຈາກເວັບໄຊທ໌ນີ້.
- 5. ຈາກ OnWorks Linux OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກ, ຕິດຕັ້ງມັນແລະດໍາເນີນການ.
ພາບຫນ້າຈໍ:
TXM
DESCRIPTION:
TXM ເປັນຟຣີ ແລະເປີດແຫຼ່ງ Unicode & XML ໂດຍອີງໃສ່ສະພາບແວດລ້ອມການວິເຄາະຕົວໜັງສື/corpus ແລະກຣາຟຟິກລູກຂ່າຍ, ຮອງຮັບ Windows, Linux ແລະ Mac OS X. ມັນຍັງສາມາດໃຊ້ອອນໄລນ໌ເປັນປະຕູເວັບມາດຕະຖານ J2EE (ຕາມ GWT) ດ້ວຍການຄວບຄຸມການເຂົ້າເຖິງທີ່ສ້າງຂຶ້ນໃນ.
ດາວໂຫລດ TXM ຮຸ່ນຫຼ້າສຸດ: http://textometrie.ens-lyon.fr/spip.php?rubrique61&lang=en
TXM ສະຫນອງເຄື່ອງມືການວິເຄາະທີ່ສົມບູນແບບ (ຄວາມສອດຄ່ອງ, ການຄົ້ນຫາຮ່ວມກັນ, ລາຍຊື່ຄວາມຖີ່, ແລະອື່ນໆ) ໂດຍອີງໃສ່ເຄື່ອງຈັກຊອກຫາຂໍ້ຄວາມເຕັມ CQP ທີ່ມີປະສິດທິພາບ (http://cwb.sourceforge.net) ແລະປະເພດຂອງຫນ້າທີ່ສະຖິຕິ (ການວິເຄາະປັດໄຈ, ການຈັດປະເພດ, ການວິເຄາະ cooccurrency, ແລະອື່ນໆ) ອີງໃສ່ຊຸດ R (http://www.r-project.org).
ອ່ານພື້ນຖານວິທະຍາສາດຢູ່ໃນເວັບໄຊທ໌ໂຄງການ Textométrie http://textometrie.ens-lyon.fr/?lang=en.
ອ່ານລາຍລະອຽດເຕັມທີ່ TEI Tools wiki http://wiki.tei-c.org/index.php/TXM.
ຄຸນລັກສະນະ
- ສະຫນອງເຄື່ອງມືການວິເຄາະຄຸນນະພາບ: concordancer ຂອງຮູບແບບ lexical ອີງໃສ່ການສອບຖາມລະດັບຄໍາແລະໂຄງສ້າງ, ອຸດົມສົມບູນ HTML ອີງໃສ່ການດັດແກ້ຂໍ້ຄວາມນໍາທິດ, ການສະແດງຮູບແບບການປະກົດຕົວ.
- ສະຫນອງເຄື່ອງມືການວິເຄາະປະລິມານ: ການວິເຄາະການຕອບສະຫນອງປັດໄຈ, ສະເພາະຄໍາສັບຕ່າງໆ constrative, ການຈັດປະເພດ hierarchical, cooccurrents ຂອງຮູບແບບ
- ເຮັດວຽກກ່ຽວກັບການເກັບກໍາຂໍ້ມູນຂອງເອກະສານເຂົ້າລະຫັດ Unicode ຂອງຮູບແບບຕ່າງໆ: ການເກັບກໍາຂໍ້ຄວາມ (TXT, XML, XML-TEI P5), ການຖອດສຽງການບັນທຶກ (XML-Transcriber), corpora aligned (XML-TMX), ຫນັງສືພິມ (XML-PPS Factiva, Europress) ) ແລະອື່ນໆອີກ.
- ນຳໃຊ້ເຄື່ອງມື NLP ຕ່າງໆໃນທັນທີໃນບົດເລື່ອງຕ່າງໆກ່ອນການວິເຄາະ (ເຊັ່ນ: TreeTagger ສໍາລັບ lemmatization ແລະ pos tagging)
- ອະນຸຍາດໃຫ້ການສ້າງ subcorpora ຕ່າງໆແລະການແບ່ງປັນ (ສໍາລັບການວິເຄາະ constrative ລະຫວ່າງໂຄງສ້າງຂໍ້ຄວາມຫຼືກຸ່ມຂອງຄໍາສັບຕ່າງໆ)
- ສົ່ງອອກຜົນໄດ້ຮັບໃນຮູບແບບ CSV, XML ຫຼື SVG
- script ທີ່ສາມາດຂັບເຄື່ອນໄດ້ສໍາລັບການເຮັດວຽກຊ້ໍາຊ້ອນອັດຕະໂນມັດຫຼືການຂະຫຍາຍເວທີ (ໃນ Groovy / Java)
- ລວມມີຕົວແກ້ໄຂຂໍ້ຄວາມເພື່ອແກ້ໄຂແຫຼ່ງຂໍ້ມູນ, ຜົນໄດ້ຮັບ ແລະສະຄຣິບ
- ແລ່ນເປັນແອັບພລິເຄຊັນ Windows, Mac OS X ຫຼື Linux
- ແລ່ນເປັນແອັບພລິເຄຊັນເວັບປະຕູເພື່ອເຂົ້າເຖິງ ແລະວິເຄາະ corpora ອອນລາຍຜ່ານຕົວທ່ອງເວັບ (ມີການຈັດການການຄວບຄຸມການເຂົ້າເຖິງ)
- ແຫຼ່ງເປີດ: ອີງໃສ່ອົງປະກອບແຫຼ່ງເປີດທີ່ດີທີ່ສຸດສໍາລັບການວິເຄາະຂໍ້ຄວາມ: ຫ້ອງສະຫມຸດ CQP, R ແລະ Java & XSLT
- ສະຖາປັດຕະຍະກໍາແບບໂມດູລາ (Eclipse RCP OSGi ແລະ J2EE conformant): ກ່ອງເຄື່ອງມືຫນຶ່ງທີ່ເຊື່ອມຕໍ່ອົງປະກອບຫຼັກທັງຫມົດແມ່ນຖືກນໍາໃຊ້ໂດຍຄໍາຮ້ອງສະຫມັກທັງຫມົດ.
- ກອບການພັດທະນາ Eclipse ຫຼື Netbeans ທີ່ມີປະສິດທິພາບ
Audience
ວິທະຍາສາດ/ການຄົ້ນຄວ້າ, ຜູ້ໃຊ້ສຸດທ້າຍ, ນັກພັດທະນາ, ຜູ້ໃຊ້ສຸດທ້າຍ/ເດັສທັອບ
ໃນການໂຕ້ຕອບຜູ້ໃຊ້
Java SWT, Web-based, Console/Terminal, Eclipse
ພາສາການຂຽນໂປຣແກຣມ
C, Groovy, Java, S/R
ສະພາບແວດລ້ອມຖານຂໍ້ມູນ
API ອື່ນໆ
ປະເພດ
ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/txm/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ໃນວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.