ນີ້ແມ່ນແອັບ Windows ທີ່ມີຊື່ວ່າ VALL-E ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ໃນນາມ GreatlyimprovedaccuracyandFixGPUmemoryincreaseduringtraining.zip. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີບ່ອນເຮັດວຽກ.
ດາວນ໌ໂຫລດແລະດໍາເນີນການອອນໄລນ໌ app ນີ້ມີຊື່ VALL-E ກັບ OnWorks ໄດ້ຟຣີ.
ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:
- 1. ດາວໂຫຼດຄໍາຮ້ອງສະຫມັກນີ້ໃນ PC ຂອງທ່ານ.
- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.
- 4. ເລີ່ມ emulator ອອນ ໄລ ນ ໌ OS OnWorks ຈາກ ເວັບ ໄຊ ທ ໌ ນີ້, ແຕ່ ດີກ ວ່າ Windows ອອນ ໄລ ນ ໌ emulator.
- 5. ຈາກ OnWorks Windows OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກແລະຕິດຕັ້ງມັນ.
- 7. ດາວໂຫລດ Wine ຈາກບ່ອນເກັບມ້ຽນຊອບແວການແຈກຢາຍ Linux ຂອງທ່ານ. ເມື່ອຕິດຕັ້ງແລ້ວ, ທ່ານສາມາດຄລິກສອງຄັ້ງ app ເພື່ອດໍາເນີນການໃຫ້ເຂົາເຈົ້າກັບ Wine. ນອກນັ້ນທ່ານຍັງສາມາດລອງ PlayOnLinux, ການໂຕ້ຕອບທີ່ແປກປະຫຼາດໃນໄລຍະ Wine ທີ່ຈະຊ່ວຍໃຫ້ທ່ານຕິດຕັ້ງໂປລແກລມ Windows ແລະເກມທີ່ນິຍົມ.
ເຫຼົ້າແວງເປັນວິທີການແລ່ນຊອບແວ Windows ໃນ Linux, ແຕ່ບໍ່ມີ Windows ທີ່ຕ້ອງການ. ເຫຼົ້າແວງແມ່ນຊັ້ນຄວາມເຂົ້າກັນໄດ້ຂອງ Windows ແຫຼ່ງເປີດທີ່ສາມາດເອີ້ນໃຊ້ໂຄງການ Windows ໂດຍກົງໃນ desktop Linux ໃດກໍໄດ້. ໂດຍພື້ນຖານແລ້ວ, Wine ກໍາລັງພະຍາຍາມປະຕິບັດໃຫມ່ຢ່າງພຽງພໍຂອງ Windows ຕັ້ງແຕ່ເລີ່ມຕົ້ນເພື່ອໃຫ້ມັນສາມາດດໍາເນີນການຄໍາຮ້ອງສະຫມັກ Windows ທັງຫມົດໄດ້ໂດຍບໍ່ຕ້ອງໃຊ້ Windows.
ໜ້າ ຈໍ
Ad
ຮ່ອມພູ
ລາຍລະອຽດ
ພວກເຮົາແນະນຳວິທີການສ້າງແບບຈໍາລອງພາສາສຳລັບການສັງເຄາະຂໍ້ຄວາມຫາສຽງເວົ້າ (TTS). ໂດຍສະເພາະ, ພວກເຮົາຝຶກອົບຮົມແບບຈໍາລອງພາສາ neural codec (ເອີ້ນວ່າ VALL-E) ໂດຍໃຊ້ລະຫັດແຍກທີ່ມາຈາກຕົວແບບ codec ສຽງ neural ຢູ່ນອກຊັ້ນວາງ, ແລະຖືວ່າ TTS ເປັນວຽກການສ້າງແບບຈໍາລອງພາສາທີ່ມີເງື່ອນໄຂແທນທີ່ຈະເປັນການຖອຍສັນຍານຢ່າງຕໍ່ເນື່ອງຄືກັບວຽກທີ່ຜ່ານມາ. ໃນລະຫວ່າງຂັ້ນຕອນກ່ອນການຝຶກອົບຮົມ, ພວກເຮົາຂະຫຍາຍຂໍ້ມູນການຝຶກອົບຮົມ TTS ເປັນ 60K ຊົ່ວໂມງຂອງການເວົ້າພາສາອັງກິດເຊິ່ງໃຫຍ່ກວ່າລະບົບທີ່ມີຢູ່ແລ້ວຫຼາຍຮ້ອຍເທົ່າ. VALL-E ອອກມາຈາກຄວາມສາມາດໃນການຮຽນຮູ້ໃນບໍລິບົດ ແລະສາມາດໃຊ້ເພື່ອສັງເຄາະສຽງເວົ້າທີ່ປັບແຕ່ງເປັນແບບສ່ວນຕົວທີ່ມີຄຸນນະພາບສູງດ້ວຍການລົງທະບຽນພຽງແຕ່ 3 ວິນາທີຂອງລຳໂພງທີ່ບໍ່ເຫັນເປັນການກະຕຸ້ນສຽງ. ຜົນໄດ້ຮັບຂອງການທົດລອງສະແດງໃຫ້ເຫັນວ່າ VALL-E ປະຕິບັດໄດ້ດີກວ່າລະບົບ TTS ທີ່ທັນສະໄໝຂອງສິນລະປະຢ່າງມີຄຸນນະພາບໃນແງ່ຂອງຄວາມເປັນທໍາມະຊາດຂອງສຽງເວົ້າ ແລະຄວາມຄ້າຍຄືກັນຂອງລໍາໂພງ. ນອກຈາກນັ້ນ, ພວກເຮົາພົບວ່າ VALL-E ສາມາດຮັກສາຄວາມຮູ້ສຶກຂອງລໍາໂພງແລະສະພາບແວດລ້ອມສຽງຂອງສຽງດັງໃນການສັງເຄາະ.
ຄຸນລັກສະນະ
- ທໍ່ຂອງ VALL-E ແມ່ນ phoneme → discrete code → waveform
- VALL-E ສ້າງລະຫັດຕົວແປງສັນຍານສຽງທີ່ແຍກກັນໂດຍອີງໃສ່ການເຕືອນຂອງ phoneme ແລະ acoustic code prompts
- VALL-E ເປີດໃຊ້ແອັບພລິເຄຊັນການສັງເຄາະສຽງເວົ້າຕ່າງໆໂດຍກົງ
- Zero-shot TTS, ການແກ້ໄຂສຽງເວົ້າ, ແລະການສ້າງເນື້ອຫາ
- ສົມທົບກັບຕົວແບບ AI ທົ່ວໄປອື່ນໆເຊັ່ນ GPT-3
- VALL-E ສາມາດສັງເຄາະສຽງເວົ້າທີ່ປັບແຕ່ງເປັນແບບສ່ວນຕົວໃນຂະນະທີ່ຮັກສາສະພາບແວດລ້ອມສຽງຂອງລຳໂພງ.
ພາສາການຂຽນໂປຣແກຣມ
Python
ປະເພດ
ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/vall-e.mirror/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ດ້ວຍວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.

