これはQwen-VLというWindowsアプリで、最新リリースはQwen-VLsourcecode.tar.gzとしてダウンロードできます。ワークステーション向けの無料ホスティングプロバイダーであるOnWorksでオンラインで実行できます。
OnWorks を使用して、Qwen-VL というアプリを無料でダウンロードし、オンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOSOnWorksオンラインエミュレーターを起動しますが、Windowsオンラインエミュレーターの方が優れています。
-5。起動したばかりのOnWorksWindows OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードしてインストールします。
-7.LinuxディストリビューションソフトウェアリポジトリからWineをダウンロードします。 インストールしたら、アプリをダブルクリックして、Wineで実行できます。 また、人気のあるWindowsプログラムやゲームのインストールに役立つWine上の豪華なインターフェイスであるPlayOnLinuxを試すこともできます。
WineはLinux上でWindowsソフトウェアを実行する方法ですが、Windowsは必要ありません。 Wineは、任意のLinuxデスクトップでWindowsプログラムを直接実行できるオープンソースのWindows互換性レイヤーです。 基本的に、Wineは、実際にWindowsを必要とせずに、これらすべてのWindowsアプリケーションを実行できるように、十分な数のWindowsを最初から再実装しようとしています。
スクリーンショットは
Ad
クウェン-VL
DESCRIPTION
Qwen-VLは、Alibaba Cloudの視覚言語大規模モデルファミリーであり、視覚と言語のモダリティを統合するように設計されています。画像入力(オプションでバウンディングボックス付き)とテキストを受け取り、出力としてテキスト(場合によってはバウンディングボックス)を生成します。モデルバリアント(VL-Plus、VL-Maxなど)は、視覚的推論、画像からのテキスト認識、きめ細かな理解、高解像度/極端なアスペクト比の画像サポートを向上させるためにアップグレードされています。Qwen-VLは、多言語入力と会話(例:中国語、英語)をサポートし、画像キャプション作成、画像に関する質問応答(VQA、DocVQA)、グラウンディング(テキストクエリからのオブジェクトまたは領域の検出)などのタスクを対象としています。
オプション
- 多くの視覚言語タスクで優れたパフォーマンスを発揮します: 画像キャプション、VQA、DocVQA、グラウンディング、画像内のテキスト認識など。
- 非常に高解像度の画像入力をサポート(最大数百万ピクセル)し、詳細なビジュアルコンテンツのための極端なアスペクト比を処理
- 多言語: 画像テキスト/会話タスクで中国語、英語、その他の言語をサポート
- バリアント(VL-Plus、VL-Max)は、機能の向上を提供します。VL-Max は、指示の追従、視覚的推論、認知のより優れたモデルなどの機能が向上しています。
- リソース使用量を削減するための微調整と量子化オプション(Int4モード、Q-LoRAなど)
- 複数画像インターリーブ会話をサポート:複数画像の比較、ストーリーテリング、対話における複数画像入力
プログラミング言語
Python
カテゴリー
このアプリケーションは、https://sourceforge.net/projects/qwen-vl.mirror/ からも入手できます。OnWorks でホストされているため、無料のオペレーティングシステムから最も簡単にオンラインで実行できます。