ນີ້ແມ່ນແອັບ Linux ທີ່ມີຊື່ວ່າ KSUCCA Corpus ເພື່ອແລ່ນໃນ Linux ອອນໄລນ໌ ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ໃນນາມ Corpus.zip. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີເຮັດວຽກ.
ດາວນ໌ໂຫລດແລະດໍາເນີນການອອນໄລນ໌ app ນີ້ມີຊື່ KSUCCA Corpus ເພື່ອດໍາເນີນການໃນ Linux ອອນໄລນ໌ກັບ OnWorks ໄດ້ຟຣີ.
ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:
- 1. ດາວໂຫຼດຄໍາຮ້ອງສະຫມັກນີ້ໃນ PC ຂອງທ່ານ.
- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.
- 4. ເລີ່ມ OnWorks Linux ອອນລາຍ ຫຼື Windows online emulator ຫຼື MACOS online emulator ຈາກເວັບໄຊທ໌ນີ້.
- 5. ຈາກ OnWorks Linux OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກ, ຕິດຕັ້ງມັນແລະດໍາເນີນການ.
ໜ້າ ຈໍ
Ad
KSUCCA Corpus ເພື່ອແລ່ນໃນ Linux ອອນໄລນ໌
ລາຍລະອຽດ
King Saud University Corpus of Classical Arabic (KSUCCA) ເປັນຜູ້ບຸກເບີກ 50 tokens annotated corpus of classical Arabic texts from the pre-Islamic era to the fourth Hijri century (ທຽບເທົ່າກັບໄລຍະເວລາຈາກສະຕະວັດທີ XNUMX ຈົນເຖິງຕົ້ນສະຕະວັດທີ XII), ເຊິ່ງ. ແມ່ນໄລຍະເວລາຂອງພາສາອາຫລັບຄລາສສິກອັນບໍລິສຸດ. ຈຸດປະສົງຕົ້ນຕໍຂອງ corpus ນີ້ແມ່ນເພື່ອນໍາໃຊ້ສໍາລັບການສຶກສາການແຜ່ກະຈາຍຂອງຄໍາສັບຕ່າງໆ Quran ໄດ້. ຢ່າງໃດກໍ່ຕາມ, ມັນສາມາດຖືກນໍາໃຊ້ເພື່ອຈຸດປະສົງການຄົ້ນຄວ້າອື່ນໆ, ເຊັ່ນ:• ພາສາອາຣັບ, ເຊິ່ງລວມມີ: lexical, morphological, syntactic, semantic ແລະ pragmatic research.
• ພາສາສາດການຄຳນວນພາສາອາຣັບ, ເຊິ່ງລວມມີ: lexical, morphological, syntactic, semantic ແລະ pragmatic ການຄົ້ນຄວ້າລວມທັງການໃຊ້ງານຕ່າງໆ.
• ການສອນພາສາອາຣັບສຳລັບທັງຊາວອາຣັບ ແລະຊາວອາຣັບ.
•ປັນຍາປະດິດ.
•ການປຸງແຕ່ງພາສາທໍາມະຊາດ.
• ການດຶງຂໍ້ມູນ.
• ການຕອບຄໍາຖາມ.
• ການແປດ້ວຍເຄື່ອງຈັກ.
ຄຸນລັກສະນະ
- ໜ່ວຍງານເອເລັກໂຕຣນິກ: ການອະນຸຍາດໃຫ້ໄວຂຶ້ນແລະຖືກຕ້ອງການສືບສວນຂອງລາຍລັກອັກສອນ Arabic.
- A corpus synchronic: ລວມທັງບົດເລື່ອງອາຫລັບຈາກໄລຍະກ່ອນຍຸກອິດສະລາມຈົນກ່ວາສັດຕະວັດທີສີ່ Hijri (ທຽບເທົ່າກັບໄລຍະທີ່ເຈັດເຖິງຕົ້ນສັດຕະວັດທີສິບເອັດຂອງສ.
- A corpus ທົ່ວໄປ: ກວມເອົາລະດັບຄວາມກ້ວາງຂອງປະເພດເຮັດໃຫ້ມັນເຫມາະສົມສໍາລັບວິຊາການຄົ້ນຄວ້າຕ່າງໆ.
- A corpus ຕົວແທນ: ມັນສາມາດຖືກນໍາໃຊ້ເປັນພື້ນຖານສໍາລັບການທົ່ວໄປກ່ຽວກັບການ Arabic ຄລາສສິກ.
- A corpus ທີ່ສົມດູນ: ຈໍານວນຕົວຢ່າງຂໍ້ຄວາມທີ່ເອົາມາຈາກແຕ່ລະປະເພດແມ່ນອັດຕາສ່ວນກັບປະເພດນັ້ນ.
- A corpus monolingual: ມີຂໍ້ຄວາມລາຍລັກອັກສອນຂອງຄລາສສິກ Arabic.
- ເປັນ corpus unvowelized: ພຽງແຕ່ຄໍາສັບຕ່າງໆຂອງຍານບໍລິສຸດ Quran ແມ່ນ vowelized.
- A corpus ດິບ: ບໍ່ມີການ tagging, lemmatization ຫຼືປະເພດຂອງຄໍາບັນຍາຍເພີ່ມເຕີມ, ພຽງແຕ່ຂໍ້ຄວາມທໍາມະດາ.
- ສະບັບຫຍໍ້ຂອງ corpus ອັດຕະໂນມັດທີ່ມີ lemma, stem, tag POS, ເພດແລະຕົວເລກແມ່ນຍັງສາມາດໃຊ້ໄດ້.
ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/ksucca-corpus/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ໃນວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.