This is the Windows app named FastVLM whose latest release can be downloaded as ml-fastvlmsourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
این برنامه با نام FastVLM with OnWorks را به صورت رایگان دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. هر شبیه ساز آنلاین OS OnWorks را از این وب سایت راه اندازی کنید، اما شبیه ساز آنلاین ویندوز بهتر است.
- 5. از OnWorks Windows OS که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. برنامه را دانلود و نصب کنید.
- 7. Wine را از مخازن نرم افزار توزیع لینوکس خود دانلود کنید. پس از نصب، می توانید روی برنامه دوبار کلیک کنید تا آنها را با Wine اجرا کنید. همچنین می توانید PlayOnLinux را امتحان کنید، یک رابط کاربری فانتزی بر روی Wine که به شما کمک می کند برنامه ها و بازی های محبوب ویندوز را نصب کنید.
Wine راهی برای اجرای نرم افزار ویندوز بر روی لینوکس است، اما بدون نیاز به ویندوز. Wine یک لایه سازگار با ویندوز منبع باز است که می تواند برنامه های ویندوز را مستقیماً بر روی هر دسکتاپ لینوکس اجرا کند. اساساً، Wine در تلاش است تا به اندازه کافی از ویندوز را از ابتدا مجدداً پیاده سازی کند تا بتواند همه آن برنامه های ویندوز را بدون نیاز به ویندوز اجرا کند.
عکس ها
Ad
فست وی ال ام
شرح
FastVLM یک پشته مدلسازی زبان بینایی متمرکز بر کارایی است که FastViTHD را معرفی میکند، یک رمزگذار بینایی ترکیبی که برای انتشار توکنهای بصری کمتر و کاهش زمان رمزگذاری، به ویژه برای تصاویر با وضوح بالا، مهندسی شده است. به جای مراحل هرس پیچیده، این طرح از طریق مقیاسبندی ورودی، وضوح و تعداد توکن را با هم معاوضه میکند و خط لوله را ساده میکند و در عین حال دقت بالایی را حفظ میکند. نتایج گزارش شده، سرعتهای چشمگیر در زمان اولین توکن و کیفیت رقابتی در مقابل VLMهای باز معاصر، از جمله مقایسه بین انواع کوچک و بزرگتر را برجسته میکند. مخزن، انواع مدل را مستند میکند، اعداد سر به سر را در برابر خطوط پایه شناخته شده نشان میدهد و توضیح میدهد که چگونه رمزگذار با ستون فقرات LLM مشترک ادغام میشود. خلاصه تحقیقات اپل، FastVLM را به عنوان هدف قرار دادن سناریوهای بلادرنگ یا حساس به تأخیر، که در آن کاهش فشار توکن بصری برای UX تعاملی حیاتی است، مطرح میکند. به طور خلاصه، این یک دستورالعمل عملی برای سریع کردن VLMها بدون اکتشافات عجیب و غریب انتخاب توکن است.
امکانات
- رمزگذار بینایی ترکیبی FastViTHD با توکنهای بصری کمتر
- کاهش قابل توجه در تأخیر کدگذاری و TTFT
- موازنه تفکیکپذیری-توکن از طریق مقیاسبندی ورودی ساده
- سازگاری با ستون فقرات استاندارد LLM در پشتههای VLM
- با هزینه بسیار کمتر، عملکرد بهتری نسبت به سطوح پایه گزارش شده است
- انواع تنظیمشده برای رژیمهای مدل کوچک و بزرگتر
زبان برنامه نویسی
پــایتــون
دسته بندی ها
این برنامهای است که میتوان آن را از https://sourceforge.net/projects/fastvlm.mirror/ نیز دریافت کرد. این برنامه در OnWorks میزبانی شده است تا بتوان آن را به سادهترین روش از یکی از سیستمهای عامل رایگان ما به صورت آنلاین اجرا کرد.