Это приложение для Linux под названием MedicalGPT, последнюю версию которого можно загрузить как v1.6.0sourcecode.zip. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Загрузите и бесплатно запустите онлайн это приложение под названием MedicalGPT с помощью OnWorks.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
СКРИНШОТЫ
Ad
МедицинскийGPT
ОПИСАНИЕ
Обучение MedicalGPT Медицинская модель GPT с конвейером обучения ChatGPT, внедрением предварительного обучения, контролируемой точной настройки, моделирования вознаграждения и обучения с подкреплением. MedicalGPT обучает крупные медицинские модели, включая вторичное предварительное обучение, контролируемую точную настройку, моделирование вознаграждений и обучение с подкреплением.
Особенности
- Первый этап: поэтапное предварительное обучение PT (Continue PreTraining), двойное предварительное обучение модели GPT на массивных данных документа предметной области для внедрения знаний предметной области.
- Второй этап: SFT (контролируемая точная настройка) контролирует точную настройку, создает набор данных для точной настройки инструкций и выполняет точную настройку инструкций на основе модели предварительного обучения для согласования намерений инструкций.
- Третий этап: моделирование модели вознаграждения RM (модель вознаграждения), построение набора данных для ранжирования предпочтений человека, обучение модели вознаграждения согласованию человеческих предпочтений, в основном по принципу «HHH», в частности «полезный, честный, безвредный».
- Четвертый этап: RL (Reinforcement Learning) основан на обучении с подкреплением с обратной связью от человека (RLHF), с использованием модели вознаграждения для обучения модели SFT, а модель генерации использует вознаграждения или штрафы для обновления своей стратегии с целью создания более качественных и более эффективных результатов. в соответствии с человеческими предпочтениями
- Мы предоставляем простой интерактивный веб-интерфейс на базе Gradio.
- После завершения обучения мы загружаем обученную модель, чтобы проверить эффект генерации текста моделью.
Язык программирования
Питон
Категории
Это приложение также можно загрузить с https://sourceforge.net/projects/medicalgpt.mirror/. Он размещен в OnWorks, чтобы его можно было проще запускать в Интернете из одной из наших бесплатных операционных систем.