これは Imagen - Pytorch という名前の Windows アプリで、最新リリースは 1.25.11sourcecode.zip としてダウンロードできます。 ワークステーション用の無料ホスティング プロバイダー OnWorks でオンラインで実行できます。
Imagen - Pytorch with OnWorks という名前のこのアプリを無料でダウンロードしてオンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOSOnWorksオンラインエミュレーターを起動しますが、Windowsオンラインエミュレーターの方が優れています。
-5。起動したばかりのOnWorksWindows OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードしてインストールします。
-7.LinuxディストリビューションソフトウェアリポジトリからWineをダウンロードします。 インストールしたら、アプリをダブルクリックして、Wineで実行できます。 また、人気のあるWindowsプログラムやゲームのインストールに役立つWine上の豪華なインターフェイスであるPlayOnLinuxを試すこともできます。
WineはLinux上でWindowsソフトウェアを実行する方法ですが、Windowsは必要ありません。 Wineは、任意のLinuxデスクトップでWindowsプログラムを直接実行できるオープンソースのWindows互換性レイヤーです。 基本的に、Wineは、実際にWindowsを必要とせずに、これらすべてのWindowsアプリケーションを実行できるように、十分な数のWindowsを最初から再実装しようとしています。
スクリーンショットは
Ad
画像 - Pytorch
DESCRIPTION
DALL-E2 に勝る Google の Text-to-Image ニューラル ネットワークである Imagen の Pytorch での実装。 これは、テキストから画像への合成のための新しい SOTA です。 アーキテクチャ的には、実際には DALL-E2 よりもはるかに単純です。 これは、大規模な事前トレーニング済み T5 モデル (アテンション ネットワーク) からのテキスト埋め込みを条件とするカスケード DDPM で構成されます。 また、分類器を使用しないガイダンス、ノイズ レベルの調整、およびメモリ効率の高いユニット設計を改善するための動的クリッピングも含まれています。 結局、CLIPも以前のネットワークも必要ないようです。 そして、研究は続けられています。 トレーニングを簡単にするために、テキスト エンコーディングを事前に計算する代わりに、テキスト文字列を直接指定できます。 (ただし、スケーリングの目的で、テキストの埋め込みとマスクを事前に計算する必要があります)
特徴
- テキストキャプションの数は、画像のバッチサイズと一致する必要があります
- ImagenTrainer ラッパー クラスを使用すると、更新を呼び出すときに、カスケード DDPM 内のすべての U ネットの指数移動平均が自動的に処理されます。
- テキストなしで Imagen をトレーニングすることもできます (無条件の画像生成)
- ImagenTrainer を利用して DataLoader インスタンスを自動的にトレーニングすることもできます
- XNUMX つのコマンド ラインを使用して、任意のテキスト プロンプトで画像を生成します
- Imagen は Classifier Free Guidance と呼ばれるアルゴリズムを使用します
プログラミング言語
Python
カテゴリー
これは https://sourceforge.net/projects/imagen-pytorch.mirror/ からも取得できるアプリケーションです。 これは、OnWorks でホストされており、無料のオペレーティング システムの XNUMX つからオンラインで簡単に実行できます。