This is the Linux app named MGIE whose latest release can be downloaded as ml-mgiesourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
Бесплатно загрузите и запустите онлайн это приложение под названием MGIE с OnWorks.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
СКРИНШОТЫ
Ad
МГИЭ
ОПИСАНИЕ
MGIE (Guiding Instruction-based Image Editing) демонстрирует, как мультимодальный LLM может анализировать инструкции по редактированию на естественном языке и затем соответствующим образом управлять преобразованиями изображений. Проект фокусируется на том, чтобы сделать редактирование объяснимым и контролируемым: модель интерпретирует текстовые инструкции, обосновывает содержание изображения и выводит правки, соответствующие намерениям пользователя. Он позиционируется как работа, включенная в ICLR 2024 Spotlight, с кодом и ссылками, которые показывают, как связать планирование языка с конкретными операциями с изображениями. Это устраняет разрыв между подсказками в свободной форме и точными правками, позволяя пользователям описывать «что» и «где» на повседневном языке. Репозиторий включает инструкции, примеры и ссылки, которые помещают MGIE в более широкую линейку мультимодальных исследований Apple. Для практиков MGIE предоставляет план для систем преобразования текста в редактирование, которые более семантически обоснованы, чем наивные конвейеры, основанные только на подсказках.
Особенности
- Анализ инструкций на естественном языке для редактирования изображений
- Мультимодальное рассуждение, связывающее текстовые планы с визуальными изменениями
- Примеры и демонстрации, соответствующие исследовательской работе
- Детальное редактирование с учетом региона
- Открытый код для воспроизводимости и адаптации
- Основа для управляемых и объяснимых агентов редактирования изображений
Язык программирования
Питон
Категории
Это приложение также можно скачать по адресу https://sourceforge.net/projects/mgie.mirror/. Оно размещено на OnWorks для максимально удобного запуска онлайн через одну из наших бесплатных операционных систем.