ນີ້ແມ່ນແອັບ Linux ທີ່ມີຊື່ວ່າ Apache Spark ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ໃນນາມ sparkv4.1.0-preview3-rc1sourcecode.zip. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີບ່ອນເຮັດວຽກ.
ດາວນ໌ໂຫລດແລະດໍາເນີນການອອນໄລນ໌ app ນີ້ມີຊື່ Apache Spark ກັບ OnWorks ໄດ້ຟຣີ.
ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:
- 1. ດາວໂຫຼດຄໍາຮ້ອງສະຫມັກນີ້ໃນ PC ຂອງທ່ານ.
- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.
- 4. ເລີ່ມ OnWorks Linux ອອນລາຍ ຫຼື Windows online emulator ຫຼື MACOS online emulator ຈາກເວັບໄຊທ໌ນີ້.
- 5. ຈາກ OnWorks Linux OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກ, ຕິດຕັ້ງມັນແລະດໍາເນີນການ.
ພາບຫນ້າຈໍ:
Apache Spark
DESCRIPTION:
Apache Spark ເປັນເຄື່ອງຈັກທີ່ເປັນເອກະພາບສໍາລັບການປະມວນຜົນຂໍ້ມູນຂະຫນາດໃຫຍ່, ສະເຫນີ APIs ສໍາລັບວຽກ batch, streaming, machine learning, ແລະ graph computation. ມັນສ້າງຂຶ້ນໃນຊຸດຂໍ້ມູນການແຈກຢາຍທີ່ທົນທານ (RDDs) ແລະຊຸດຂໍ້ມູນ DataFrame/Dataset abstractions ໃໝ່ກວ່າເພື່ອສະໜອງການຄິດໄລ່ໃນໜ່ວຍຄວາມຈຳໃນກຸ່ມກຸ່ມຕ່າງໆ. ເຄື່ອງຈັກປະຕິບັດຂອງ Spark ຈັດການການກໍານົດເວລາ, ການສັ່ນສະເທືອນ, ການເກັບຂໍ້ມູນ, ແລະພື້ນທີ່ຂໍ້ມູນເພື່ອໃຫ້ຜູ້ໃຊ້ສາມາດສຸມໃສ່ການຫັນປ່ຽນແທນທີ່ຈະເປັນທໍ່ໂຄງສ້າງພື້ນຖານ. ດ້ວຍ Spark Streaming (microbatches) ແລະ Structured Streaming, ມັນສະຫນອງການປະມວນຜົນເຫດການທີ່ມີເວລາແຝງຕ່ຳທີ່ເໝາະສົມກັບການວິເຄາະແບບສົດໆ. ຫ້ອງສະໝຸດ MLlib ທີ່ມີໃນຕົວໃຫ້ລະບົບການຮຽນຮູ້ເຄື່ອງຈັກທີ່ສາມາດປັບຂະ ໜາດ ໄດ້, ໃນຂະນະທີ່ GraphX ຊ່ວຍໃຫ້ການຄິດໄລ່ກາຟປະສົມປະສານກັບທໍ່ຂໍ້ມູນ. Spark ສະຫນັບສະຫນູນຫຼາຍພາສາ - Scala, Java, Python, R - ແລະເຊື່ອມຕໍ່ກັບລະບົບການເກັບຮັກສາຈໍານວນຫຼາຍເຊັ່ນ HDFS, S3, Cassandra, ແລະແພລະຕະຟອມການຖ່າຍທອດເຊັ່ນ Kafka, ເຮັດໃຫ້ມັນເປັນທາງເລືອກທີ່ຫຼາກຫຼາຍສໍາລັບວຽກງານຂໍ້ມູນໃຫຍ່ໃນການວິເຄາະ, ETL, ແລະວິທະຍາສາດຂໍ້ມູນ.
ຄຸນລັກສະນະ
- ການປະມວນຜົນຂໍ້ມູນ batch ແລະ real-time / streaming ຜ່ານ Structured Streaming ແລະ APIs ອື່ນໆ
- DataFrame ແລະ SQL APIs ເພື່ອອະນຸຍາດໃຫ້ສອບຖາມແບບ SQL ແລະການຫັນປ່ຽນຂໍ້ມູນທີ່ມີໂຄງສ້າງແລະເຄິ່ງໂຄງສ້າງ
- ຫໍສະໝຸດການຮຽນຮູ້ເຄື່ອງຈັກ (MLlib) ທີ່ມີລະບົບວິທີສຳລັບການຈັດປະເພດ, ການຖົດຖອຍ, ການຈັດກຸ່ມ, ແລະອື່ນໆ.
- ຄວາມສາມາດໃນການປະມວນຜົນກາຟຜ່ານ GraphX, ສໍາລັບການວິເຄາະໂຄງສ້າງກາຟແລະອື່ນໆ.
- ສະຫນັບສະຫນູນຫຼາຍພາສາ: Scala, Java, Python, R (ແລະສະຫນັບສະຫນູນການທົດລອງສໍາລັບຄົນອື່ນ)
- ຄວາມສາມາດທີ່ຈະດໍາເນີນການກ່ຽວກັບກຸ່ມໂດຍຜ່ານການຈັດການກຸ່ມຕ່າງໆ (ສະຖານທີ່, YARN, Mesos, Kubernetes), ການເຊື່ອມໂຍງກັບລະບົບການເກັບຂໍ້ມູນຈໍານວນຫຼາຍ (HDFS, S3, ແລະອື່ນໆ)
ພາສາການຂຽນໂປຣແກຣມ
Scala
ປະເພດ
ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/apache-spark.mirror/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ດ້ວຍວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.