Đây là ứng dụng Windows có tên The SpeechBrain Toolkit có bản phát hành mới nhất có thể tải xuống dưới dạng v0.5.15.zip. Nó có thể được chạy trực tuyến trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng này có tên The SpeechBrain Toolkit with OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động bất kỳ trình giả lập trực tuyến OS OnWorks nào từ trang web này, nhưng trình giả lập trực tuyến Windows tốt hơn.
- 5. Từ Hệ điều hành Windows OnWorks bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng và cài đặt nó.
- 7. Tải xuống Wine từ kho phần mềm phân phối Linux của bạn. Sau khi cài đặt, bạn có thể nhấp đúp vào ứng dụng để chạy chúng với Wine. Bạn cũng có thể thử PlayOnLinux, một giao diện đẹp mắt trên Wine sẽ giúp bạn cài đặt các chương trình và trò chơi phổ biến của Windows.
Wine là một cách để chạy phần mềm Windows trên Linux, nhưng không cần Windows. Wine là một lớp tương thích Windows mã nguồn mở có thể chạy các chương trình Windows trực tiếp trên bất kỳ máy tính để bàn Linux nào. Về cơ bản, Wine đang cố gắng triển khai lại đủ Windows từ đầu để nó có thể chạy tất cả các ứng dụng Windows đó mà không thực sự cần đến Windows.
MÀN HÌNH:
Bộ công cụ SpeechBrain
SỰ MIÊU TẢ:
SpeechBrain là bộ công cụ AI đàm thoại mã nguồn mở và tất cả trong một. Nó được thiết kế đơn giản, cực kỳ linh hoạt và thân thiện với người dùng. Hiệu suất cạnh tranh hoặc hiện đại đạt được trong các lĩnh vực khác nhau. SpeechBrain hỗ trợ các phương pháp tiên tiến nhất để nhận dạng giọng nói từ đầu đến cuối, bao gồm các mô hình dựa trên CTC, CTC+sự chú ý, bộ chuyển đổi, máy biến áp và mô hình ngôn ngữ thần kinh dựa trên mạng thần kinh tái phát và máy biến áp. Tính năng nhận dạng người nói đã được triển khai trong rất nhiều ứng dụng thực tế. SpeechBrain cung cấp các mô hình khác nhau để nhận dạng người nói, bao gồm X-vector, ECAPA-TDNN, PLDA và học tương phản. Mặt nạ quang phổ, ánh xạ quang phổ và tăng cường miền thời gian là các phương pháp khác nhau đã có sẵn trong SpeechBrain. Các phương thức phân tách như Conv-TasNet, DualPath RNN và SepFormer cũng được triển khai. SpeechBrain cung cấp các quy trình tăng cường giọng nói hiệu quả và thân thiện với GPU cũng như trích xuất các tính năng âm thanh.
Tính năng
- SpeechBrain cung cấp nhiều mô hình được đào tạo trước có thể dễ dàng triển khai với các giao diện được thiết kế độc đáo
- SpeechBrain được thiết kế để tăng tốc độ nghiên cứu và phát triển công nghệ giọng nói
- SpeechBrain cho phép bạn tùy chỉnh dễ dàng và nhanh chóng bất kỳ phần nào trong quy trình phát biểu của mình
- SpeechBrain cho phép người dùng cài đặt qua PyPI để nhanh chóng sử dụng thư viện chuẩn hoặc qua cài đặt cục bộ để xem công thức nấu ăn
- Mọi công thức SpeechBrain đều dựa trên một tệp YAML tóm tắt tất cả các chức năng và siêu tham số của hệ thống
- SpeechBrain được thiết kế để nghiên cứu và phát triển
Ngôn ngữ lập trình
Python
Danh Mục
Đây là một ứng dụng cũng có thể được tìm nạp từ https://sourceforge.net/projects/the-speechbrain-toolkit.mirror/. Nó đã được lưu trữ trong OnWorks để có thể chạy trực tuyến theo cách dễ dàng nhất từ một trong các Hệ điều hành miễn phí của chúng tôi.