GoGPT Best VPN GoSearch

Biểu tượng yêu thích OnWorks

Tải xuống Hướng dẫn kèm Phản hồi cho Linux

Tải xuống miễn phí ứng dụng Following Instructions with Feedback Linux để chạy trực tuyến trên Ubuntu trực tuyến, Fedora trực tuyến hoặc Debian trực tuyến

Đây là ứng dụng Linux có tên Following Instructions with Feedback, phiên bản mới nhất có thể tải xuống dưới dạng following-instructions-human-feedbacksourcecode.tar.gz. Ứng dụng có thể chạy trực tuyến trên nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks dành cho máy trạm.

Tải xuống và chạy trực tuyến ứng dụng có tên Following Instructions with Feedback with OnWorks miễn phí.

Làm theo các hướng dẫn sau để chạy ứng dụng này:

- 1. Đã tải ứng dụng này xuống PC của bạn.

- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.

- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.

- 4. Khởi động trình giả lập trực tuyến OnWorks Linux hoặc trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MACOS từ trang web này.

- 5. Từ Hệ điều hành OnWorks Linux mà bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.

- 6. Tải xuống ứng dụng, cài đặt và chạy nó.

MÀN HÌNH

Ad


Thực hiện theo hướng dẫn với phản hồi


MÔ TẢ

Kho lưu trữ following-instructions-human-feedback chứa mã và tài liệu bổ sung hỗ trợ công việc của OpenAI trong việc đào tạo các mô hình ngôn ngữ (mô hình InstructGPT) để tuân thủ tốt hơn các hướng dẫn của người dùng thông qua phản hồi của con người. Kho lưu trữ lưu trữ thẻ mô hình, các mẫu đầu ra đánh giá tự động và các hướng dẫn gắn nhãn được sử dụng trong quy trình. Kho lưu trữ này được liên kết rõ ràng với bài báo "Đào tạo các mô hình ngôn ngữ để tuân theo các hướng dẫn với phản hồi của con người" và đóng vai trò là tài liệu tham khảo về cách OpenAI thu thập các hướng dẫn chú thích, chạy so sánh tùy chọn và đánh giá hành vi của mô hình. Kho lưu trữ không phải là triển khai đầy đủ của toàn bộ quy trình RLHF, mà là một trung tâm lưu trữ hỗ trợ các nghiên cứu đã công bố—cung cấp tính minh bạch xung quanh các tiêu chuẩn đánh giá và gắn nhãn của con người. Kho lưu trữ bao gồm các thư mục như automatic-eval-samples (các mẫu đầu ra của mô hình trên các tác vụ chuẩn) và model-card.md mô tả hành vi, hạn chế và độ lệch dự kiến ​​của các mô hình InstructGPT.



Tính năng

  • Lưu trữ các kết quả mẫu đánh giá từ các thí nghiệm InstructGPT
  • model-card.md mô tả cách sử dụng mô hình, các hạn chế và cân nhắc về an toàn
  • Hướng dẫn ghi nhãn/hướng dẫn chú thích được sử dụng cho người đánh giá
  • Thư mục "automatic-eval-samples" có cấu trúc hiển thị đầu ra cơ sở so với đầu ra đã được tinh chỉnh
  • Tính minh bạch về cách OpenAI đo lường thứ hạng ưu tiên và sự liên kết của mô hình
  • Liên kết và tài liệu tham khảo đến bài nghiên cứu gốc và tài liệu



Danh Mục

có chất lượng

Đây là một ứng dụng cũng có thể được tải xuống từ https://sourceforge.net/projects/following-inst-feedback.mirror/. Ứng dụng này được lưu trữ trên OnWorks để có thể chạy trực tuyến dễ dàng nhất từ ​​một trong những Hệ điều hành miễn phí của chúng tôi.


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

Lệnh Linux

Ad




×
quảng cáo
❤️Mua sắm, đặt phòng hoặc mua tại đây — không mất phí, giúp duy trì các dịch vụ miễn phí.