ນີ້ແມ່ນແອັບ Windows ທີ່ມີຊື່ວ່າ Deequ ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ເປັນ 2.0.12sourcecode.tar.gz. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີບ່ອນເຮັດວຽກ.
ດາວນ໌ໂຫລດແລະດໍາເນີນການອອນໄລນ໌ app ນີ້ມີຊື່ Deequ ກັບ OnWorks ໄດ້ຟຣີ.
ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:
- 1. ດາວໂຫຼດຄໍາຮ້ອງສະຫມັກນີ້ໃນ PC ຂອງທ່ານ.
- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.
- 4. ເລີ່ມ emulator ອອນ ໄລ ນ ໌ OS OnWorks ຈາກ ເວັບ ໄຊ ທ ໌ ນີ້, ແຕ່ ດີກ ວ່າ Windows ອອນ ໄລ ນ ໌ emulator.
- 5. ຈາກ OnWorks Windows OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກແລະຕິດຕັ້ງມັນ.
- 7. ດາວໂຫລດ Wine ຈາກບ່ອນເກັບມ້ຽນຊອບແວການແຈກຢາຍ Linux ຂອງທ່ານ. ເມື່ອຕິດຕັ້ງແລ້ວ, ທ່ານສາມາດຄລິກສອງຄັ້ງ app ເພື່ອດໍາເນີນການໃຫ້ເຂົາເຈົ້າກັບ Wine. ນອກນັ້ນທ່ານຍັງສາມາດລອງ PlayOnLinux, ການໂຕ້ຕອບທີ່ແປກປະຫຼາດໃນໄລຍະ Wine ທີ່ຈະຊ່ວຍໃຫ້ທ່ານຕິດຕັ້ງໂປລແກລມ Windows ແລະເກມທີ່ນິຍົມ.
ເຫຼົ້າແວງເປັນວິທີການແລ່ນຊອບແວ Windows ໃນ Linux, ແຕ່ບໍ່ມີ Windows ທີ່ຕ້ອງການ. ເຫຼົ້າແວງແມ່ນຊັ້ນຄວາມເຂົ້າກັນໄດ້ຂອງ Windows ແຫຼ່ງເປີດທີ່ສາມາດເອີ້ນໃຊ້ໂຄງການ Windows ໂດຍກົງໃນ desktop Linux ໃດກໍໄດ້. ໂດຍພື້ນຖານແລ້ວ, Wine ກໍາລັງພະຍາຍາມປະຕິບັດໃຫມ່ຢ່າງພຽງພໍຂອງ Windows ຕັ້ງແຕ່ເລີ່ມຕົ້ນເພື່ອໃຫ້ມັນສາມາດດໍາເນີນການຄໍາຮ້ອງສະຫມັກ Windows ທັງຫມົດໄດ້ໂດຍບໍ່ຕ້ອງໃຊ້ Windows.
ໜ້າ ຈໍ
Ad
Deequ
ລາຍລະອຽດ
Deequ ແມ່ນຫ້ອງສະຫມຸດທີ່ສ້າງຂຶ້ນໂດຍ Amazon (AWS Labs) ຢູ່ເທິງສຸດຂອງ Apache Spark ເພື່ອເຮັດໃຫ້ການທົດສອບຄຸນນະພາບຂໍ້ມູນອັດຕະໂນມັດ, ການກວດສອບຂໍ້ຈໍາກັດແລະການກວດສອບຄວາມຜິດປົກກະຕິໃນລະດັບ. ມັນຊ່ວຍໃຫ້ຜູ້ໃຊ້ກໍານົດການຢືນຢັນຫຼືຂໍ້ຈໍາກັດກ່ຽວກັບຂໍ້ມູນ (ເຊັ່ນ: ຄວາມສົມບູນ, ຄວາມເປັນເອກະລັກ, min / max, correlations ແລະອື່ນໆ), ດໍາເນີນການ metrics, ກວດສອບວ່າຂໍ້ມູນຕອບສະຫນອງຄວາມຄາດຫວັງ, ແນະນໍາຂໍ້ຈໍາກັດ, ກວດພົບ drift / ຜິດປົກກະຕິ, ແລະປະສົມປະສານເຂົ້າໄປໃນທໍ່ຂໍ້ມູນເພື່ອໃຫ້ຂໍ້ມູນທີ່ບໍ່ດີຖືກຈັບໄວກ່ອນທີ່ຈະໃຫ້ລະບົບ downstream ຫຼື ML.
ຄຸນລັກສະນະ
- ການຄິດໄລ່ເມຕຣິກສໍາລັບຊຸດຂໍ້ມູນຂະຫນາດໃຫຍ່: ຄວາມສົມບູນ, min/max, ຄວາມເປັນເອກະລັກ, correlation ແລະອື່ນໆໂດຍນໍາໃຊ້ການລວມ Spark
- ຄໍານິຍາມແລະການກວດສອບຂໍ້ຈໍາກັດ: ນັກພັດທະນາສາມາດກໍານົດຂໍ້ຈໍາກັດດ້ານຄຸນນະພາບຂອງຂໍ້ມູນແລະໃຫ້ Deequ ກວດເບິ່ງວ່າຂໍ້ມູນພໍໃຈກັບພວກເຂົາບໍ?
- ຂໍ້ຈໍາກັດຂໍ້ແນະນໍາ / profileing: ຄວາມສາມາດໃນການຂໍ້ມູນໂປຣໄຟລ໌ແລະແນະນໍາຂໍ້ຈໍາກັດທີ່ເປັນປະໂຫຍດອັດຕະໂນມັດ
- ການກວດຫາຄວາມຜິດກະຕິ / ການຕິດຕາມການລອຍຂ້າມຂໍ້ມູນແລ່ນ / ຮຸ່ນເພື່ອໃຫ້ການປ່ຽນແປງ / ຮູບແບບຂໍ້ມູນທີ່ບໍ່ຄາດຄິດຖືກຈັບ
- ປະສົມປະສານກັບແຫຼ່ງຂໍ້ມູນທີ່ແຈກຢາຍ / ລະບົບການເກັບຮັກສາ (ເຊັ່ນ: S3, HDFS ແລະອື່ນໆ), ເຮັດວຽກເປັນສ່ວນຫນຶ່ງຂອງ Spark pipelines
- ສາມາດໃຊ້ຜ່ານ Python abstraction (PyDeequ) ສໍາລັບຜູ້ທີ່ມັກການໂຕ້ຕອບ Python ຫຼາຍກວ່າ Scala ເມື່ອໃຊ້ Spark
ພາສາການຂຽນໂປຣແກຣມ
Scala
ປະເພດ
ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/deequ.mirror/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ດ້ວຍວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.