Đây là ứng dụng Windows có tên DeepEval, phiên bản mới nhất có thể tải xuống dưới dạng NewInterfaces, ReduceETLCode_50_!sourcecode.tar.gz. Ứng dụng có thể chạy trực tuyến trên nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks dành cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng có tên DeepEval với OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động bất kỳ trình giả lập trực tuyến OS OnWorks nào từ trang web này, nhưng trình giả lập trực tuyến Windows tốt hơn.
- 5. Từ Hệ điều hành Windows OnWorks bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng và cài đặt nó.
- 7. Tải xuống Wine từ kho phần mềm phân phối Linux của bạn. Sau khi cài đặt, bạn có thể nhấp đúp vào ứng dụng để chạy chúng với Wine. Bạn cũng có thể thử PlayOnLinux, một giao diện đẹp mắt trên Wine sẽ giúp bạn cài đặt các chương trình và trò chơi phổ biến của Windows.
Wine là một cách để chạy phần mềm Windows trên Linux, nhưng không cần Windows. Wine là một lớp tương thích Windows mã nguồn mở có thể chạy các chương trình Windows trực tiếp trên bất kỳ máy tính để bàn Linux nào. Về cơ bản, Wine đang cố gắng triển khai lại đủ Windows từ đầu để nó có thể chạy tất cả các ứng dụng Windows đó mà không thực sự cần đến Windows.
MÀN HÌNH
Ad
Đánh giá sâu
MÔ TẢ
DeepEval là một khuôn khổ đánh giá LLM mã nguồn mở, dễ sử dụng, để đánh giá và thử nghiệm các hệ thống mô hình ngôn ngữ lớn. Nó tương tự như Pytest nhưng chuyên dùng để kiểm tra đơn vị đầu ra LLM. DeepEval kết hợp nghiên cứu mới nhất để đánh giá đầu ra LLM dựa trên các số liệu như G-Eval, ảo giác, mức độ liên quan của câu trả lời, RAGAS, v.v., sử dụng LLM và nhiều mô hình NLP khác chạy cục bộ trên máy của bạn để đánh giá. Cho dù ứng dụng của bạn được triển khai thông qua RAG hay tinh chỉnh, LangChain hay LlamaIndex, DeepEval đều có thể đáp ứng. Với nó, bạn có thể dễ dàng xác định các siêu tham số tối ưu để cải thiện đường ống RAG của mình, ngăn chặn sự trôi dạt nhanh chóng hoặc thậm chí chuyển đổi từ OpenAI sang lưu trữ Llama2 của riêng bạn một cách tự tin.
Tính năng
- Nhiều loại số liệu đánh giá LLM sẵn sàng sử dụng (tất cả đều có giải thích) được cung cấp bởi BẤT KỲ LLM nào bạn chọn
- Red team ứng dụng LLM của bạn để phát hiện hơn 40 lỗ hổng bảo mật chỉ trong vài dòng mã
- Tài liệu có sẵn
- Ví dụ có sẵn
- Đánh giá toàn bộ tập dữ liệu của bạn theo khối lượng lớn trong dưới 20 dòng mã Python song song. Thực hiện việc này thông qua CLI theo cách giống Pytest hoặc thông qua hàm evaluate() của chúng tôi
- Tạo số liệu tùy chỉnh của riêng bạn được tích hợp tự động với hệ sinh thái của DeepEval bằng cách kế thừa lớp số liệu cơ sở của DeepEval
Ngôn ngữ lập trình
Python
Danh Mục
Đây là ứng dụng cũng có thể được tải xuống từ https://sourceforge.net/projects/deepeval.mirror/. Ứng dụng này được lưu trữ trên OnWorks để có thể chạy trực tuyến theo cách dễ dàng nhất từ một trong những Hệ điều hành miễn phí của chúng tôi.