ນີ້ແມ່ນແອັບ Linux ທີ່ມີຊື່ວ່າ Following Instructions with Feedback ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ເປັນ following-instructions-human-feedbacksourcecode.tar.gz. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີສໍາລັບບ່ອນເຮັດວຽກ.
ດາວນ໌ໂຫລດແລະດໍາເນີນການອອນໄລນ໌ app ນີ້ມີຊື່ການປະຕິບັດຕາມຄໍາແນະນໍາທີ່ມີຄໍາຄຶດຄໍາເຫັນກັບ OnWorks ໄດ້ຟຣີ.
ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:
- 1. ດາວໂຫຼດຄໍາຮ້ອງສະຫມັກນີ້ໃນ PC ຂອງທ່ານ.
- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.
- 4. ເລີ່ມ OnWorks Linux ອອນລາຍ ຫຼື Windows online emulator ຫຼື MACOS online emulator ຈາກເວັບໄຊທ໌ນີ້.
- 5. ຈາກ OnWorks Linux OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກ, ຕິດຕັ້ງມັນແລະດໍາເນີນການ.
ໜ້າ ຈໍ
Ad
ປະຕິບັດຕາມຄໍາແນະນໍາກັບຄໍາຄິດເຫັນ
ລາຍລະອຽດ
ຄໍາແນະນໍາຕໍ່ໄປນີ້ - human-feedback repository ປະກອບດ້ວຍລະຫັດແລະອຸປະກອນເສີມທີ່ສະຫນັບສະຫນູນການເຮັດວຽກຂອງ OpenAI ໃນແບບຈໍາລອງພາສາການຝຶກອົບຮົມ (InstructGPT model) ທີ່ດີກວ່າປະຕິບັດຕາມຄໍາແນະນໍາຂອງຜູ້ໃຊ້ໂດຍຜ່ານຄໍາຕິຊົມຂອງມະນຸດ. repo ເປັນເຈົ້າພາບບັດແບບຈໍາລອງ, ຕົວຢ່າງຜົນໄດ້ຮັບການປະເມີນຜົນອັດຕະໂນມັດ, ແລະຄໍາແນະນໍາການຕິດສະຫຼາກທີ່ໃຊ້ໃນຂະບວນການ. ມັນໄດ້ຖືກຜູກມັດຢ່າງຊັດເຈນກັບເອກະສານ "ຮູບແບບພາສາການຝຶກອົບຮົມເພື່ອປະຕິບັດຕາມຄໍາແນະນໍາກັບຄໍາຕິຊົມຂອງມະນຸດ", ແລະເຮັດຫນ້າທີ່ເປັນເອກະສານອ້າງອີງສໍາລັບວິທີທີ່ OpenAI ເກັບກໍາຂໍ້ແນະນໍາ, ດໍາເນີນການປຽບທຽບຄວາມມັກ, ແລະປະເມີນພຶດຕິກໍາຕົວແບບ. ຄັງເກັບມ້ຽນບໍ່ແມ່ນການປະຕິບັດຢ່າງເຕັມທີ່ຂອງທໍ່ RLHF ທັງຫມົດ, ແຕ່ແທນທີ່ຈະເປັນສູນເກັບມ້ຽນທີ່ສະຫນັບສະຫນູນການຄົ້ນຄວ້າທີ່ຈັດພີມມາ - ສະຫນອງຄວາມໂປ່ງໃສກ່ຽວກັບການປະເມີນຜົນແລະມາດຕະຖານການຕິດສະຫຼາກຂອງມະນຸດ. ມັນປະກອບມີບັນດາລາຍການເຊັ່ນ: ຕົວຢ່າງອັດຕະໂນມັດ-eval-samples (ຕົວຢ່າງຂອງຜົນໄດ້ຮັບຂອງຕົວແບບໃນຫນ້າວຽກ benchmark) ແລະ model-card.md ທີ່ອະທິບາຍເຖິງພຶດຕິກໍາ, ຂໍ້ຈໍາກັດ, ແລະຄວາມລໍາອຽງຂອງຕົວແບບ InstructGPT.
ຄຸນລັກສະນະ
- ຮວບຮວມເອົາຕົວຢ່າງການປະເມີນຜົນຈາກການທົດລອງ InstructGPT
- model-card.md ອະທິບາຍການນຳໃຊ້ຕົວແບບ, ຂໍ້ຈຳກັດ, ແລະການພິຈາລະນາຄວາມປອດໄພ
- ຄູ່ມືການຕິດສະຫຼາກ / ຄໍາແນະນໍາຄໍາບັນຍາຍທີ່ໃຊ້ສໍາລັບຜູ້ປະເມີນຜົນຂອງມະນຸດ
- ໂຟນເດີ “automatic-eval-samples” ທີ່ມີໂຄງສ້າງສະແດງໃຫ້ເຫັນພື້ນຖານທຽບກັບຜົນໄດ້ຮັບທີ່ປັບລະອຽດ
- ຄວາມໂປ່ງໃສກ່ຽວກັບວິທີ OpenAI ວັດແທກການຈັດອັນດັບຄວາມມັກຂອງຕົວແບບ ແລະການຈັດຮຽງ
- ການເຊື່ອມໂຍງແລະການອ້າງອີງເຖິງເອກະສານການຄົ້ນຄວ້າຕົ້ນສະບັບແລະເອກະສານ
ປະເພດ
ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/following-inst-feedback.mirror/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ດ້ວຍວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.
