This is the Linux app named SVoice (Speech Voice Separation) whose latest release can be downloaded as svoicesourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
ดาวน์โหลดและใช้งานแอปออนไลน์ชื่อ SVoice (Speech Voice Separation) พร้อม OnWorks ได้ฟรี
ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:
- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ
- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ
- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว
- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OnWorks Linux หรือ Windows ออนไลน์ หรือโปรแกรมจำลองออนไลน์ MACOS จากเว็บไซต์นี้
- 5. จาก OnWorks Linux OS คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ
- 6. ดาวน์โหลดแอปพลิเคชั่น ติดตั้ง และเรียกใช้
ภาพหน้าจอ
Ad
SVoice (การแยกเสียงพูด)
DESCRIPTION
SVoice คือการนำการศึกษาเรื่องการแยกเสียงพูดของผู้พูดของ Facebook Research มาใช้บน PyTorch ตามที่อธิบายไว้ในบทความ “การแยกเสียงพูดด้วยจำนวนผู้พูดที่ไม่ทราบจำนวน” โปรเจ็กต์นี้นำเสนอกรอบการเรียนรู้เชิงลึกที่สามารถแยกลำดับเสียงผสมที่มีผู้พูดหลายคนพูดพร้อมกันได้โดยไม่ต้องทราบจำนวนผู้พูดล่วงหน้า โมเดลนี้ใช้เครือข่ายประสาทเทียมแบบเกต (gated neural network) ที่มีบล็อกประมวลผลแบบวนซ้ำ (recurrent processing blocks) ซึ่งจะแยกเสียงพูดออกจากกันผ่านขั้นตอนการคำนวณหลายขั้นตอน ในขณะที่ยังคงรักษาความสม่ำเสมอของผู้พูดในช่องสัญญาณเอาต์พุต โมเดลที่แยกจากกันจะถูกฝึกสำหรับจำนวนผู้พูดที่แตกต่างกัน และโมเดลที่มีความจุสูงสุดจะกำหนดจำนวนผู้พูดจริงในเสียงผสมแบบไดนามิก ที่เก็บประกอบด้วยสคริปต์ที่จำเป็นทั้งหมดสำหรับการฝึก การเตรียมชุดข้อมูล การฝึกแบบกระจาย การประเมิน และการแยกเสียง
คุณสมบัติ
- การใช้งาน PyTorch แบบครบวงจรสำหรับการแยกเสียงพูดโดยไม่ทราบจำนวนผู้พูด
- ใช้บล็อก RNN แบบเกตและตัวเข้ารหัสแบบ Convolutional เพื่อการสร้างแบบจำลองลำโพงหลายตัวที่ทนทาน
- กำหนดค่าได้ผ่าน Hydra พร้อมจุดตรวจสอบอัตโนมัติและการจัดการการทดลอง
- รองรับการฝึกอบรมแบบกระจายหลาย GPU และการกำหนดค่าชุดข้อมูลที่ง่ายดาย
- รวมถึงเครื่องมือสร้างชุดข้อมูลสำหรับส่วนผสมสังเคราะห์ที่มีเสียงดังและก้อง
- เครื่องมือประเมินและอนุมานในตัวสำหรับการแยกและให้คะแนนตัวอย่างคำพูด
ภาษาโปรแกรม
ไพธอน, ยูนิกซ์เชลล์
หมวดหมู่
นี่คือแอปพลิเคชันที่สามารถดึงข้อมูลจาก https://sourceforge.net/projects/svoice.mirror/ ได้ แอปพลิเคชันนี้โฮสต์อยู่ใน OnWorks เพื่อให้ใช้งานออนไลน์ได้ง่ายที่สุดจากระบบปฏิบัติการฟรีของเรา