זוהי אפליקציית Windows בשם VALL-E שניתן להוריד את המהדורה האחרונה שלה כרמת דיוק משופרת מאוד וזיכרון GPU תיקון גדל במהלך training.zip. ניתן להפעיל אותו באופן מקוון בספק האירוח החינמי OnWorks עבור תחנות עבודה.
הורד והפעל באינטרנט את האפליקציה הזו בשם VALL-E עם OnWorks בחינם.
בצע את ההוראות הבאות כדי להפעיל את האפליקציה הזו:
- 1. הורד את היישום הזה למחשב שלך.
- 2. הזן במנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש שאתה רוצה.
- 3. העלה את היישום הזה במנהל קבצים כזה.
- 4. הפעל כל אמולטור מקוון של OS OnWorks מאתר זה, אך עדיף אמולטור מקוון של Windows.
- 5. ממערכת ההפעלה OnWorks Windows שזה עתה התחלת, עבור אל מנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש הרצוי.
- 6. הורד את האפליקציה והתקן אותה.
- 7. הורד את Wine ממאגרי התוכנה שלך להפצות לינוקס. לאחר ההתקנה, תוכל ללחוץ פעמיים על האפליקציה כדי להפעיל אותם עם Wine. אתה יכול גם לנסות את PlayOnLinux, ממשק מפואר מעל Wine שיעזור לך להתקין תוכניות ומשחקים פופולריים של Windows.
Wine היא דרך להפעיל תוכנת Windows על לינוקס, אך ללא צורך ב-Windows. Wine היא שכבת תאימות של Windows בקוד פתוח שיכולה להריץ תוכניות Windows ישירות על כל שולחן עבודה של לינוקס. בעיקרו של דבר, Wine מנסה להטמיע מחדש מספיק של Windows מאפס כדי שהוא יוכל להריץ את כל יישומי Windows מבלי להזדקק ל-Windows.
בצילומי מסך
Ad
עֶמֶק
תיאור
אנו מציגים גישת מודל שפה עבור סינתזת טקסט לדיבור (TTS). באופן ספציפי, אנו מאמנים מודל שפת קודקים עצביים (הנקראים VALL-E) באמצעות קודים נפרדים הנגזרים ממודל קוד אודיו עצבי מהמדף, ורואים ב-TTS משימת מידול שפה מותנית ולא רגרסיה רציפה של אותות כמו בעבודה הקודמת. במהלך שלב ההדרכה, אנו מגדילים את נתוני האימון ב-TTS ל-60K שעות של דיבור באנגלית, שגדול מאות מונים ממערכות קיימות. VALL-E מתעוררת יכולות למידה בתוך הקשר וניתן להשתמש בה כדי לסנתז דיבור מותאם אישית באיכות גבוהה עם הקלטה של 3 שניות בלבד של רמקול בלתי נראה כהנחיה אקוסטית. תוצאות הניסוי מראות ש-VALL-E עולה בהרבה על מערכת ה-TTS החדישה ביותר עם זריקת אפס במונחים של טבעיות הדיבור ודמיון הדוברים. בנוסף, אנו מוצאים ש-VALL-E יכול לשמר את הרגש והסביבה האקוסטית של הדובר של ההנחיה האקוסטית בסינתזה.
תכונות
- הצינור של VALL-E הוא פונמה → קוד בדיד → צורת גל
- VALL-E מייצר את קודי ה-Codec האודיו הבדידים המבוססים על הנחיות פונמה וקוד אקוסטי
- VALL-E מאפשר ישירות יישומים שונים של סינתזת דיבור
- TTS בצילום אפס, עריכת דיבור ויצירת תוכן
- בשילוב עם דגמי AI גנרטיביים אחרים כמו GPT-3
- VALL-E יכול לסנתז דיבור מותאם אישית תוך שמירה על הסביבה האקוסטית של הנחיית הרמקול
שפת תכנות
פיתון
כל הקטגוריות
זוהי אפליקציה שניתן להביא גם מ-https://sourceforge.net/projects/vall-e.mirror/. הוא התארח ב-OnWorks על מנת להפעיל אותו באינטרנט בצורה הקלה ביותר מאחת ממערכות ההפעלה החינמיות שלנו.

