This is the Linux app named MGIE whose latest release can be downloaded as ml-mgiesourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
OnWorks を使用して、MGIE というこのアプリを無料でダウンロードし、オンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショットは
Ad
マギー
DESCRIPTION
MGIE(Guiding Instruction-based Image Editing)は、マルチモーダルLLMが自然言語編集指示を解析し、それに応じて画像変換を行う方法を示します。このプロジェクトは、編集を説明可能かつ制御可能にすることに重点を置いています。このモデルはテキストガイダンスを解釈し、画像コンテンツに基づいて推論し、ユーザーの意図に沿った編集を出力します。これはICLR 2024 Spotlight研究に位置付けられており、言語計画を具体的な画像操作に結び付ける方法を示すコードとリファレンスが含まれています。これにより、ユーザーが日常言語で「何を」そして「どこを」説明できるようにすることで、自由形式のプロンプトと正確な編集の間のギャップが埋められます。リポジトリには、MGIEをAppleの幅広いマルチモーダル研究に位置付ける手順、例、リンクが含まれています。実践者にとって、MGIEは、単純なプロンプトのみのパイプラインよりも意味的に根拠のあるテキスト編集システムの青写真を提供します。
オプション
- 画像編集のための自然言語命令解析
- テキストプランと視覚的変化を結びつけるマルチモーダル推論
- 研究論文に沿った例とデモ
- きめ細かな、領域認識型の編集動作
- 再現性と適応性のためのオープンコード
- 制御可能かつ説明可能な画像編集エージェントの基礎
プログラミング言語
Python
カテゴリー
このアプリケーションは、https://sourceforge.net/projects/mgie.mirror/ からも入手できます。OnWorks でホストされているため、無料のオペレーティングシステムから最も簡単にオンラインで実行できます。