Đây là ứng dụng Linux có tên PaLM + RLHF - Pytorch, phiên bản mới nhất có thể tải xuống dưới dạng 0.5.4sourcecode.tar.gz. Ứng dụng có thể chạy trực tuyến trên nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks dành cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng có tên PaLM + RLHF - Pytorch với OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động trình giả lập trực tuyến OnWorks Linux hoặc trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MACOS từ trang web này.
- 5. Từ Hệ điều hành OnWorks Linux mà bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng, cài đặt và chạy nó.
MÀN HÌNH
Ad
PaLM + RLHF - Pytorch
MÔ TẢ
PaLM-rlhf-pytorch là một triển khai PyTorch của Mô hình Ngôn ngữ Pathways (PaLM) với Học tăng cường từ Phản hồi của Con người (RLHF). Nó được thiết kế để tinh chỉnh các mô hình ngôn ngữ quy mô lớn với sự phù hợp sở thích của con người, tương tự như phương pháp đào tạo các mô hình như ChatGPT của OpenAI.
Tính năng
- Triển khai RLHF để tinh chỉnh các mô hình ngôn ngữ quy mô lớn
- Sử dụng PPO (Tối ưu hóa chính sách gần đúng) để tăng cường tính ổn định của học tập
- Được tối ưu hóa để đào tạo trên phần cứng phân tán như GPU và TPU
- Hỗ trợ cả việc đào tạo trước và tinh chỉnh mô hình phần thưởng
- Được xây dựng trên PyTorch với các thành phần có thể mở rộng và mô-đun
- Được thiết kế để thử nghiệm đào tạo AI phù hợp với con người
Ngôn ngữ lập trình
Python
Danh Mục
Đây là một ứng dụng cũng có thể được tải xuống từ https://sourceforge.net/projects/palm-rlhf-pytorch.mirror/. Ứng dụng này được lưu trữ trên OnWorks để có thể chạy trực tuyến dễ dàng nhất từ một trong những Hệ điều hành miễn phí của chúng tôi.