これは VLLM という名前の Linux アプリで、最新リリースは v0.2.1.post1sourcecode.zip としてダウンロードできます。 ワークステーション用の無料ホスティング プロバイダー OnWorks でオンラインで実行できます。
VLLM with OnWorks という名前のこのアプリをオンラインで無料でダウンロードして実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショットは
Ad
VLLM
DESCRIPTION
vLLM は、LLM 推論と提供のための高速で使いやすいライブラリです。 並列サンプリング、ビームサーチなどを含む、さまざまなデコードアルゴリズムを使用した高スループットのサービス。
特徴
- 最先端のサービス スループット
- PagedAttendant によるアテンション キーと値のメモリの効率的な管理
- 受信リクエストの継続的なバッチ処理
- 最適化された CUDA カーネル
- 人気のHuggingFaceモデルとのシームレスな統合
- 分散推論のためのテンソル並列処理のサポート
プログラミング言語
Python
カテゴリー
これは、https://sourceforge.net/projects/vllm.mirror/ から取得できるアプリケーションです。 無料のオペレーティング システムの XNUMX つから最も簡単な方法でオンラインで実行できるように、OnWorks でホストされています。