Đây là ứng dụng Linux có tên Opik, phiên bản mới nhất có thể tải xuống là 1.8.87sourcecode.tar.gz. Có thể chạy trực tuyến trên nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng có tên Opik với OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động trình giả lập trực tuyến OnWorks Linux hoặc trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MACOS từ trang web này.
- 5. Từ Hệ điều hành OnWorks Linux mà bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng, cài đặt và chạy nó.
MÀN HÌNH:
Opic
SỰ MIÊU TẢ:
Tự tin đánh giá, kiểm tra và giám sát các ứng dụng LLM. Opik là một nền tảng nguồn mở để đánh giá, kiểm tra và giám sát các ứng dụng LLM. Được xây dựng bởi Comet. Ghi lại, sắp xếp, tìm kiếm và hiểu từng bước ứng dụng LLM của bạn thực hiện để tạo phản hồi. Chú thích thủ công, xem và so sánh các phản hồi LLM trong một bảng thân thiện với người dùng. Ghi lại dấu vết trong quá trình phát triển và sản xuất. Chạy thử nghiệm với các lời nhắc khác nhau và đánh giá so với một bộ thử nghiệm. Chọn và chạy các số liệu đánh giá được cấu hình sẵn hoặc tự xác định số liệu của riêng bạn bằng thư viện SDK tiện lợi của chúng tôi. Tham khảo ý kiến của các thẩm phán LLM tích hợp để giải quyết các vấn đề phức tạp như phát hiện ảo giác, tính thực tế và kiểm duyệt.
Tính năng
- Theo dõi tất cả các cuộc gọi và dấu vết LLM trong quá trình phát triển và sản xuất
- Chú thích các cuộc gọi LLM của bạn bằng cách ghi lại điểm phản hồi bằng Python SDK hoặc UI
- Tự động hóa quá trình đánh giá đơn xin cấp bằng LLM của bạn
- Lưu trữ các trường hợp thử nghiệm và chạy thử nghiệm
- Sử dụng LLM của Opik như một thước đo đánh giá cho các vấn đề phức tạp như phát hiện ảo giác, điều tiết và đánh giá RAG
- Chạy đánh giá như một phần của quy trình CI/CD của bạn bằng cách sử dụng tích hợp PyTest của chúng tôi
Ngôn ngữ lập trình
Java
Danh Mục
Đây là ứng dụng cũng có thể được tải xuống từ https://sourceforge.net/projects/opik.mirror/. Ứng dụng này được lưu trữ trên OnWorks để có thể chạy trực tuyến theo cách dễ dàng nhất từ một trong những Hệ điều hành miễn phí của chúng tôi.