Đây là ứng dụng Linux có tên DeepEval, bản phát hành mới nhất có thể tải xuống dưới dạng NewLoadingBars,AndCloudStoragesourcecode.tar.gz. Có thể chạy trực tuyến trên nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng có tên DeepEval với OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động trình giả lập trực tuyến OnWorks Linux hoặc trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MACOS từ trang web này.
- 5. Từ Hệ điều hành OnWorks Linux mà bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng, cài đặt và chạy nó.
MÀN HÌNH
Ad
Đánh giá sâu
MÔ TẢ
DeepEval là một khuôn khổ đánh giá LLM mã nguồn mở, dễ sử dụng, để đánh giá và thử nghiệm các hệ thống mô hình ngôn ngữ lớn. Nó tương tự như Pytest nhưng chuyên dùng để kiểm tra đơn vị đầu ra LLM. DeepEval kết hợp nghiên cứu mới nhất để đánh giá đầu ra LLM dựa trên các số liệu như G-Eval, ảo giác, mức độ liên quan của câu trả lời, RAGAS, v.v., sử dụng LLM và nhiều mô hình NLP khác chạy cục bộ trên máy của bạn để đánh giá. Cho dù ứng dụng của bạn được triển khai thông qua RAG hay tinh chỉnh, LangChain hay LlamaIndex, DeepEval đều có thể đáp ứng. Với nó, bạn có thể dễ dàng xác định các siêu tham số tối ưu để cải thiện đường ống RAG của mình, ngăn chặn sự trôi dạt nhanh chóng hoặc thậm chí chuyển đổi từ OpenAI sang lưu trữ Llama2 của riêng bạn một cách tự tin.
Tính năng
- Nhiều loại số liệu đánh giá LLM sẵn sàng sử dụng (tất cả đều có giải thích) được cung cấp bởi BẤT KỲ LLM nào bạn chọn
- Red team ứng dụng LLM của bạn để phát hiện hơn 40 lỗ hổng bảo mật chỉ trong vài dòng mã
- Tài liệu có sẵn
- Ví dụ có sẵn
- Đánh giá toàn bộ tập dữ liệu của bạn theo khối lượng lớn trong dưới 20 dòng mã Python song song. Thực hiện việc này thông qua CLI theo cách giống Pytest hoặc thông qua hàm evaluate() của chúng tôi
- Tạo số liệu tùy chỉnh của riêng bạn được tích hợp tự động với hệ sinh thái của DeepEval bằng cách kế thừa lớp số liệu cơ sở của DeepEval
Ngôn ngữ lập trình
Python
Danh Mục
Đây là ứng dụng cũng có thể được tải xuống từ https://sourceforge.net/projects/deepeval.mirror/. Ứng dụng này được lưu trữ trên OnWorks để có thể chạy trực tuyến theo cách dễ dàng nhất từ một trong những Hệ điều hành miễn phí của chúng tôi.