Это приложение для Linux под названием VLLM, последнюю версию которого можно загрузить как v0.2.1.post1sourcecode.zip. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Загрузите и запустите онлайн это приложение под названием VLLM с помощью OnWorks бесплатно.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
СКРИНШОТЫ
Ad
ВЛЛМ
ОПИСАНИЕ
vLLM — это быстрая и простая в использовании библиотека для вывода и обслуживания LLM. Высокопроизводительное обслуживание с различными алгоритмами декодирования, включая параллельную выборку, поиск луча и многое другое.
Особенности
- Современная пропускная способность обслуживания
- Эффективное управление памятью ключей и значений внимания с помощью PagedAttention
- Непрерывная пакетная обработка входящих запросов.
- Оптимизированные ядра CUDA
- Полная интеграция с популярными моделями HuggingFace.
- Поддержка тензорного параллелизма для распределенного вывода
Язык программирования
Питон
Категории
Это приложение также можно загрузить с https://sourceforge.net/projects/vllm.mirror/. Он размещен в OnWorks, чтобы его можно было проще запускать в Интернете из одной из наших бесплатных операционных систем.