Đây là ứng dụng Linux có tên GLM-4.5, phiên bản mới nhất có thể tải xuống dưới dạng GLM-4.5-main.zip. Ứng dụng có thể chạy trực tuyến trên nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks dành cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng có tên GLM-4.5 với OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động trình giả lập trực tuyến OnWorks Linux hoặc trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MACOS từ trang web này.
- 5. Từ Hệ điều hành OnWorks Linux mà bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng, cài đặt và chạy nó.
MÀN HÌNH
Ad
GLM-4.5
MÔ TẢ
GLM-4.5 là một mô hình ngôn ngữ lớn nguồn mở tiên tiến được Z.ai thiết kế cho các ứng dụng tác nhân thông minh. Mô hình GLM-4.5 hàng đầu có tổng cộng 355 tỷ tham số với 32 tỷ tham số hoạt động, trong khi phiên bản GLM-4.5-Air nhỏ gọn cung cấp tổng cộng 106 tỷ tham số và 12 tỷ tham số hoạt động. Cả hai mô hình đều hợp nhất khả năng lập luận, mã hóa và tác nhân thông minh, cung cấp hai chế độ: chế độ suy nghĩ cho lập luận phức tạp và sử dụng công cụ, và chế độ không suy nghĩ cho phản hồi tức thì. Chúng được phát hành theo giấy phép MIT, cho phép sử dụng thương mại và phát triển thứ cấp. GLM-4.5 đạt hiệu suất mạnh mẽ trên 12 điểm chuẩn tiêu chuẩn công nghiệp, xếp hạng thứ 3 chung cuộc, trong khi GLM-4.5-Air cân bằng kết quả cạnh tranh với hiệu quả cao hơn. Các mô hình hỗ trợ độ chính xác FP8 và BF16 và có thể xử lý các cửa sổ ngữ cảnh rất lớn lên đến 128K mã thông báo. Suy luận linh hoạt được hỗ trợ thông qua các khuôn khổ như vLLM và SGLang với các trình phân tích cú pháp gọi công cụ và lập luận được bao gồm.
Tính năng
- Mô hình nền móng quy mô lớn với tham số 355B (32B hoạt động) và biến thể nhỏ gọn 106B (12B hoạt động)
- Hỗ trợ lý luận kết hợp giữa chế độ suy nghĩ và không suy nghĩ để có sự tương tác linh hoạt
- Mã nguồn mở theo giấy phép MIT, cho phép phát triển thương mại và thứ cấp
- Hiệu suất chuẩn cao trên 12 bài kiểm tra tiêu chuẩn công nghiệp, xếp hạng thứ 3 chung cuộc
- Hỗ trợ độ chính xác FP8 và BF16 để suy luận hiệu quả trên GPU hiện đại
- Độ dài ngữ cảnh cực dài lên tới 128,000 mã thông báo cho các tác vụ phức tạp, quy mô lớn
- Trình phân tích cú pháp suy luận và gọi công cụ tích hợp tương thích với các khuôn khổ suy luận vLLM và SGLang
- Hỗ trợ tinh chỉnh thông qua LoRA, tinh chỉnh có giám sát (SFT) và học tăng cường (RL)
Ngôn ngữ lập trình
Python
Danh Mục
Đây là một ứng dụng cũng có thể được tải xuống từ https://sourceforge.net/projects/glm-4-5/. Ứng dụng này được lưu trữ trên OnWorks để có thể chạy trực tuyến dễ dàng nhất từ một trong những Hệ điều hành miễn phí của chúng tôi.