Это приложение Linux под названием DeepEval, последний релиз которого можно загрузить как NewLoadingBars,AndCloudStoragesourcecode.tar.gz. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Загрузите и запустите онлайн приложение DeepEval с помощью OnWorks бесплатно.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
СКРИНШОТЫ
Ad
DeepEval
ОПИСАНИЕ
DeepEval — это простая в использовании среда оценки LLM с открытым исходным кодом для оценки и тестирования систем моделей большого языка. Она похожа на Pytest, но специализируется на модульном тестировании выходных данных LLM. DeepEval включает в себя новейшие исследования для оценки выходных данных LLM на основе таких метрик, как G-Eval, галлюцинация, релевантность ответа, RAGAS и т. д., которые используют LLM и различные другие модели NLP, которые запускаются локально на вашем компьютере для оценки. Независимо от того, реализовано ли ваше приложение с помощью RAG или тонкой настройки, LangChain или LlamaIndex, DeepEval поможет вам. С его помощью вы можете легко определить оптимальные гиперпараметры для улучшения вашего конвейера RAG, предотвратить дрейф подсказок или даже перейти с OpenAI на хостинг собственного Llama2 с уверенностью.
Особенности
- Большое разнообразие готовых к использованию показателей оценки LLM (все с пояснениями), поддерживаемых ЛЮБЫМ LLM по вашему выбору
- Red Team исправит ваше приложение LLM на наличие более 40 уязвимостей безопасности в нескольких строках кода
- Доступная документация
- Доступны примеры
- Оцените весь ваш набор данных оптом в менее чем 20 строках кода Python параллельно. Сделайте это через CLI в стиле Pytest или через нашу функцию estimate()
- Создавайте собственные метрики, которые автоматически интегрируются с экосистемой DeepEval, наследуя базовый класс метрик DeepEval.
Язык программирования
Питон
Категории
Это приложение, которое также можно загрузить с https://sourceforge.net/projects/deepeval.mirror/. Оно размещено в OnWorks для того, чтобы его можно было запустить онлайн самым простым способом из одной из наших бесплатных операционных систем.