این برنامه ویندوزی SVoice (جداسازی صدای گفتار) نام دارد که آخرین نسخه آن را میتوانید با نام svoicesourcecode.tar.gz دانلود کنید. این برنامه را میتوان به صورت آنلاین در ارائه دهنده خدمات میزبانی وب رایگان OnWorks برای ایستگاههای کاری اجرا کرد.
این برنامه با نام SVoice (جداسازی صدای گفتار) را با OnWorks به صورت رایگان دانلود و آنلاین اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. هر شبیه ساز آنلاین OS OnWorks را از این وب سایت راه اندازی کنید، اما شبیه ساز آنلاین ویندوز بهتر است.
- 5. از OnWorks Windows OS که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. برنامه را دانلود و نصب کنید.
- 7. Wine را از مخازن نرم افزار توزیع لینوکس خود دانلود کنید. پس از نصب، می توانید روی برنامه دوبار کلیک کنید تا آنها را با Wine اجرا کنید. همچنین می توانید PlayOnLinux را امتحان کنید، یک رابط کاربری فانتزی بر روی Wine که به شما کمک می کند برنامه ها و بازی های محبوب ویندوز را نصب کنید.
Wine راهی برای اجرای نرم افزار ویندوز بر روی لینوکس است، اما بدون نیاز به ویندوز. Wine یک لایه سازگار با ویندوز منبع باز است که می تواند برنامه های ویندوز را مستقیماً بر روی هر دسکتاپ لینوکس اجرا کند. اساساً، Wine در تلاش است تا به اندازه کافی از ویندوز را از ابتدا مجدداً پیاده سازی کند تا بتواند همه آن برنامه های ویندوز را بدون نیاز به ویندوز اجرا کند.
عکس ها
Ad
SVoice (جداسازی صدای گفتار)
شرح
SVoice یک پیادهسازی مبتنی بر PyTorch از مطالعهی فیسبوک در مورد جداسازی صدای گوینده است که در مقالهی «جداسازی صدا با تعداد نامشخصی از گویندگان متعدد» شرح داده شده است. این پروژه یک چارچوب یادگیری عمیق ارائه میدهد که قادر به جداسازی توالیهای صوتی مختلط است که در آن چندین نفر به طور همزمان صحبت میکنند، بدون اطلاع قبلی از تعداد گویندگان. این مدل از شبکههای عصبی دروازهدار با بلوکهای پردازش مکرر استفاده میکند که صداها را در چندین مرحله محاسباتی از هم جدا میکنند، در حالی که ثبات گوینده را در کانالهای خروجی حفظ میکنند. مدلهای جداگانه برای تعداد گویندگان مختلف آموزش داده میشوند و مدل با بزرگترین ظرفیت به صورت پویا تعداد واقعی گویندگان را در یک مخلوط تعیین میکند. مخزن شامل تمام اسکریپتهای لازم برای آموزش، آمادهسازی مجموعه دادهها، آموزش توزیعشده، ارزیابی و جداسازی صدا است.
امکانات
- پیادهسازی سرتاسری PyTorch برای جداسازی گفتار با تعداد گویندگان ناشناخته
- از بلوکهای RNN دروازهدار و انکودرهای کانولوشن برای مدلسازی قوی چند بلندگو استفاده میکند.
- قابل تنظیم از طریق Hydra با قابلیت بررسی خودکار و مدیریت آزمایش
- پشتیبانی از آموزش توزیعشده چند پردازنده گرافیکی و پیکربندی آسان مجموعه دادهها
- شامل ابزارهای تولید مجموعه داده برای مخلوطهای مصنوعی پر سر و صدا و پرانعکاس است
- ابزارهای ارزیابی و استنتاج داخلی برای جداسازی و امتیازدهی نمونههای گفتاری
زبان برنامه نویسی
پایتون، یونیکس شل
دسته بندی ها
این برنامهای است که میتوان آن را از https://sourceforge.net/projects/svoice.mirror/ نیز دریافت کرد. این برنامه در OnWorks میزبانی شده است تا بتوان آن را به سادهترین روش از یکی از سیستمهای عامل رایگان ما به صورت آنلاین اجرا کرد.
