This is the Linux app named MGIE whose latest release can be downloaded as ml-mgiesourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
Scarica ed esegui online gratuitamente questa app chiamata MGIE con OnWorks.
Segui queste istruzioni per eseguire questa app:
- 1. Scaricata questa applicazione sul tuo PC.
- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 3. Carica questa applicazione in tale file manager.
- 4. Avviare l'emulatore online OnWorks Linux o Windows online o l'emulatore online MACOS da questo sito Web.
- 5. Dal sistema operativo OnWorks Linux che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 6. Scarica l'applicazione, installala ed eseguila.
IMMAGINI
Ad
MGIE
DESCRIZIONE
MGIE (Guiding Instruction-based Image Editing) dimostra come un LLM multimodale possa analizzare istruzioni di editing in linguaggio naturale e quindi guidare le trasformazioni delle immagini di conseguenza. Il progetto si concentra sul rendere le modifiche spiegabili e controllabili: il modello interpreta le istruzioni testuali, ragiona sul contenuto delle immagini e produce modifiche in linea con l'intento dell'utente. È posizionato come un lavoro Spotlight ICLR 2024, con codice e riferimenti che mostrano come collegare la pianificazione del linguaggio a operazioni concrete sulle immagini. Questo colma il divario tra prompt in formato libero e modifiche precise, consentendo agli utenti di descrivere "cosa" e "dove" nel linguaggio quotidiano. Il repository include istruzioni, esempi e link che collocano MGIE all'interno della più ampia linea di ricerca multimodale di Apple. Per i professionisti, MGIE fornisce un modello per sistemi di text-to-edit più radicati semanticamente rispetto alle ingenue pipeline basate solo su prompt.
Caratteristiche
- Analisi delle istruzioni in linguaggio naturale per l'editing delle immagini
- Ragionamento multimodale che lega i piani del testo ai cambiamenti visivi
- Esempi e demo allineati con il documento di ricerca
- Comportamento di modifica dettagliato e basato sulla regione
- Codice aperto per riproducibilità e adattamento
- Base per agenti di modifica delle immagini controllabili e spiegabili
Linguaggio di programmazione
Python
Categorie
Questa applicazione può essere scaricata anche da https://sourceforge.net/projects/mgie.mirror/. È ospitata su OnWorks per poter essere eseguita online nel modo più semplice da uno dei nostri sistemi operativi gratuiti.