ດາວໂຫຼດ Apache Spark ສໍາລັບ Linux

ນີ້ແມ່ນແອັບ Linux ທີ່ມີຊື່ວ່າ Apache Spark ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ໃນນາມ sparkv4.1.0-preview3-rc1sourcecode.zip. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີບ່ອນເຮັດວຽກ.

 
 

ດາວ​ນ​໌​ໂຫລດ​ແລະ​ດໍາ​ເນີນ​ການ​ອອນ​ໄລ​ນ​໌ app ນີ້​ມີ​ຊື່ Apache Spark ກັບ OnWorks ໄດ້​ຟຣີ​.

ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:

- 1. ດາວ​ໂຫຼດ​ຄໍາ​ຮ້ອງ​ສະ​ຫມັກ​ນີ້​ໃນ PC ຂອງ​ທ່ານ​.

- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.

- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.

- 4. ເລີ່ມ OnWorks Linux ອອນລາຍ ຫຼື Windows online emulator ຫຼື MACOS online emulator ຈາກເວັບໄຊທ໌ນີ້.

- 5. ຈາກ OnWorks Linux OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.

- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກ, ຕິດຕັ້ງມັນແລະດໍາເນີນການ.

ພາບຫນ້າຈໍ:


Apache Spark


DESCRIPTION:

Apache Spark ເປັນເຄື່ອງຈັກທີ່ເປັນເອກະພາບສໍາລັບການປະມວນຜົນຂໍ້ມູນຂະຫນາດໃຫຍ່, ສະເຫນີ APIs ສໍາລັບວຽກ batch, streaming, machine learning, ແລະ graph computation. ມັນສ້າງຂຶ້ນໃນຊຸດຂໍ້ມູນການແຈກຢາຍທີ່ທົນທານ (RDDs) ແລະຊຸດຂໍ້ມູນ DataFrame/Dataset abstractions ໃໝ່ກວ່າເພື່ອສະໜອງການຄິດໄລ່ໃນໜ່ວຍຄວາມຈຳໃນກຸ່ມກຸ່ມຕ່າງໆ. ເຄື່ອງຈັກປະຕິບັດຂອງ Spark ຈັດການການກໍານົດເວລາ, ການສັ່ນສະເທືອນ, ການເກັບຂໍ້ມູນ, ແລະພື້ນທີ່ຂໍ້ມູນເພື່ອໃຫ້ຜູ້ໃຊ້ສາມາດສຸມໃສ່ການຫັນປ່ຽນແທນທີ່ຈະເປັນທໍ່ໂຄງສ້າງພື້ນຖານ. ດ້ວຍ Spark Streaming (microbatches) ແລະ Structured Streaming, ມັນສະຫນອງການປະມວນຜົນເຫດການທີ່ມີເວລາແຝງຕ່ຳທີ່ເໝາະສົມກັບການວິເຄາະແບບສົດໆ. ຫ້ອງສະໝຸດ MLlib ທີ່ມີໃນຕົວໃຫ້ລະບົບການຮຽນຮູ້ເຄື່ອງຈັກທີ່ສາມາດປັບຂະ ໜາດ ໄດ້, ໃນຂະນະທີ່ GraphX ​​ຊ່ວຍໃຫ້ການຄິດໄລ່ກາຟປະສົມປະສານກັບທໍ່ຂໍ້ມູນ. Spark ສະຫນັບສະຫນູນຫຼາຍພາສາ - Scala, Java, Python, R - ແລະເຊື່ອມຕໍ່ກັບລະບົບການເກັບຮັກສາຈໍານວນຫຼາຍເຊັ່ນ HDFS, S3, Cassandra, ແລະແພລະຕະຟອມການຖ່າຍທອດເຊັ່ນ Kafka, ເຮັດໃຫ້ມັນເປັນທາງເລືອກທີ່ຫຼາກຫຼາຍສໍາລັບວຽກງານຂໍ້ມູນໃຫຍ່ໃນການວິເຄາະ, ETL, ແລະວິທະຍາສາດຂໍ້ມູນ.



ຄຸນ​ລັກ​ສະ​ນະ

  • ການປະມວນຜົນຂໍ້ມູນ batch ແລະ real-time / streaming ຜ່ານ Structured Streaming ແລະ APIs ອື່ນໆ
  • DataFrame ແລະ SQL APIs ເພື່ອອະນຸຍາດໃຫ້ສອບຖາມແບບ SQL ແລະການຫັນປ່ຽນຂໍ້ມູນທີ່ມີໂຄງສ້າງແລະເຄິ່ງໂຄງສ້າງ
  • ຫໍສະໝຸດການຮຽນຮູ້ເຄື່ອງຈັກ (MLlib) ທີ່ມີລະບົບວິທີສຳລັບການຈັດປະເພດ, ການຖົດຖອຍ, ການຈັດກຸ່ມ, ແລະອື່ນໆ.
  • ຄວາມສາມາດໃນການປະມວນຜົນກາຟຜ່ານ GraphX, ສໍາລັບການວິເຄາະໂຄງສ້າງກາຟແລະອື່ນໆ.
  • ສະຫນັບສະຫນູນຫຼາຍພາສາ: Scala, Java, Python, R (ແລະສະຫນັບສະຫນູນການທົດລອງສໍາລັບຄົນອື່ນ)
  • ຄວາມ​ສາ​ມາດ​ທີ່​ຈະ​ດໍາ​ເນີນ​ການ​ກ່ຽວ​ກັບ​ກຸ່ມ​ໂດຍ​ຜ່ານ​ການ​ຈັດ​ການ​ກຸ່ມ​ຕ່າງໆ (ສະ​ຖານ​ທີ່​, YARN​, Mesos​, Kubernetes​)​, ການ​ເຊື່ອມ​ໂຍງ​ກັບ​ລະ​ບົບ​ການ​ເກັບ​ຂໍ້​ມູນ​ຈໍາ​ນວນ​ຫຼາຍ (HDFS​, S3​, ແລະ​ອື່ນໆ​)


ພາສາການຂຽນໂປຣແກຣມ

Scala


ປະເພດ

Frameworks

ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/apache-spark.mirror/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ດ້ວຍວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.



ລ່າສຸດ Linux ແລະ Windows ໂຄງການອອນໄລນ໌


ໝວດໝູ່ເພື່ອດາວໂຫລດຊອບແວ ແລະໂປຣແກຣມສຳລັບ Windows ແລະ Linux