این برنامه لینوکسی HunyuanImage-3.0 نام دارد که آخرین نسخه آن را میتوانید با نام HunyuanImage-3.0sourcecode.tar.gz دانلود کنید. این برنامه را میتوان به صورت آنلاین در ارائه دهنده خدمات میزبانی وب رایگان OnWorks برای ایستگاههای کاری اجرا کرد.
این برنامه با نام HunyuanImage-3.0 را به صورت رایگان با OnWorks دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. OnWorks Linux آنلاین یا شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MACOS را از این وب سایت راه اندازی کنید.
- 5. از سیستم عامل لینوکس OnWorks که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. اپلیکیشن را دانلود کرده، نصب و اجرا کنید.
اسکرین شات ها:
HunyuanImage-3.0
DESCRIPTION:
HunyuanImage-3.0 یک مدل تولید متن به تصویر چندوجهی قدرتمند و بومی است که توسط تیم Hunyuan شرکت Tencent منتشر شده است. این مدل، درک و تولید چندوجهی را در یک چارچوب خودهمبستگی واحد، یکپارچه میکند و به جای تکیه بر اجزای انتشار تصویر جداگانه، روشهای متن و تصویر را به طور یکپارچه ترکیب میکند. این مدل از معماری Mixture-of-Experts (MoE) با بسیاری از زیرشبکههای متخصص برای مقیاسپذیری کارآمد استفاده میکند و تنها زیرمجموعهای از متخصصان را در هر توکن مستقر میکند که امکان شمارش پارامترهای بزرگ را بدون انفجار هزینه استنتاج خطی فراهم میکند. این مدل برای رقابت با سیستمهای تولید تصویر منبع بسته در نظر گرفته شده است و هدف آن دستیابی به وفاداری بالا، پایبندی سریع، جزئیات دقیق و حتی استدلال "دانش جهانی" (یعنی استفاده از زمینه، معناشناسی یا عقل سلیم در تولید) است. مخزن GitHub شامل کد، اسکریپتها، دستورالعملهای بارگذاری مدل، ابزارهای استنتاج، مدیریت سریع و ادغام با ابزارهای استاندارد ML (مانند Hugging Face / Transformers) است.
امکانات
- معماری خودرگرسیو چندوجهی یکپارچه (متن + تصویر در یک مدل)
- مقیاسبندی ترکیبی از متخصصان (MoE): ۶۴ متخصص، با زیرمجموعه فعال قابل انتخاب به ازای هر توکن
- پایبندی قوی به دستورات و ثبات معنایی، به ویژه برای دستورات طولانی/پیچیده (از متنهای «هزار کاراکتری» پشتیبانی میکند)
- امکان تولید تصاویر با متن/عناصر تایپوگرافی جاسازیشده (رندرینگ دقیق متن)
- استدلال «دانش جهانی»: این مدل میتواند به طور خودکار، پرسشهای پراکنده را با جزئیات زمینهای یا واقعی غنی کند.
- بهینهسازی عملکرد و انعطافپذیری هسته (مثلاً بکاندهای توجه قابل انتخاب، استراتژیهای استنتاج وزارت آموزش و پرورش)
زبان برنامه نویسی
پــایتــون
دسته بندی ها
این برنامهای است که میتوان آن را از https://sourceforge.net/projects/hunyuanimage-3-0.mirror/ نیز دریافت کرد. این برنامه در OnWorks میزبانی شده است تا بتوان آن را به سادهترین روش به صورت آنلاین از یکی از سیستمهای عامل رایگان ما اجرا کرد.