هذا تطبيق لينكس يُدعى HunyuanImage-3.0، ويمكن تنزيل أحدث إصدار منه باسم HunyuanImage-3.0sourcecode.tar.gz. ويمكن تشغيله عبر الإنترنت من خلال موفر الاستضافة المجاني OnWorks لمحطات العمل.
قم بتنزيل وتشغيل هذا التطبيق المسمى HunyuanImage-3.0 عبر الإنترنت مع OnWorks مجانًا.
اتبع هذه التعليمات لتشغيل هذا التطبيق:
- 1. قم بتنزيل هذا التطبيق على جهاز الكمبيوتر الخاص بك.
- 2. أدخل في مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX باسم المستخدم الذي تريده.
- 3. تحميل هذا التطبيق في هذا الملف.
- 4. ابدأ تشغيل OnWorks Linux عبر الإنترنت أو محاكي Windows عبر الإنترنت أو محاكي MACOS عبر الإنترنت من هذا الموقع.
- 5. من نظام تشغيل OnWorks Linux الذي بدأته للتو ، انتقل إلى مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX مع اسم المستخدم الذي تريده.
- 6. قم بتنزيل التطبيق وتثبيته وتشغيله.
SCREENSHOTS
Ad
HunyuanImage-3.0
الوصف
HunyuanImage-3.0 هو نموذج قوي ومتكامل متعدد الوسائط لتوليد النصوص إلى الصور، أصدره فريق Hunyuan التابع لشركة Tencent. يوحّد هذا النموذج فهم وتوليد الوسائط المتعددة في إطار عمل انحداري تلقائي واحد، يجمع بين أنماط النص والصورة بسلاسة بدلاً من الاعتماد على مكونات انتشار منفصلة للصور فقط. يستخدم هذا النموذج بنية مزيج الخبراء (MoE) مع العديد من شبكات الخبراء الفرعية للتوسع بكفاءة، مع نشر مجموعة فرعية فقط من الخبراء لكل رمز، مما يسمح بأعداد كبيرة من المعلمات دون تكلفة استدلال خطي باهظة. صُمم هذا النموذج ليكون منافسًا لأنظمة توليد الصور مغلقة المصدر، ويهدف إلى تحقيق دقة عالية، وسرعة في التنفيذ، ودقة في التفاصيل، وحتى استدلال قائم على "المعرفة العالمية" (أي الاستفادة من السياق، والدلالات، أو المنطق السليم في التوليد). يتضمن مستودع GitHub التعليمات البرمجية، والبرامج النصية، وتعليمات تحميل النموذج، وأدوات الاستدلال، والمعالجة الفورية، والتكامل مع أدوات التعلم الآلي القياسية (مثل Hugging Face / Transformers).
شرح المميزات:
- هندسة الانحدار التلقائي المتعدد الوسائط الموحد (نص + صورة في نموذج واحد)
- مقياس مزيج الخبراء (MoE): 64 خبيرًا، مع مجموعة فرعية نشطة قابلة للاختيار لكل رمز
- الالتزام القوي بالمطالبات والاتساق الدلالي، وخاصة بالنسبة للمطالبات الطويلة / المعقدة (يدعم النص "على مستوى ألف حرف")
- القدرة على إنشاء صور تحتوي على نص مضمن / عناصر طباعية (تقديم نص دقيق)
- "استدلال "المعرفة العالمية": يمكن للنموذج أن يثري بشكل مستقل المطالبات المتفرقة بتفاصيل سياقية أو واقعية
- تحسينات الأداء ومرونة النواة (على سبيل المثال، واجهات الاهتمام القابلة للتحديد، واستراتيجيات استنتاج MoE)
لغة البرمجة
Python
التصنيفات
هذا تطبيق يُمكن تنزيله أيضًا من https://sourceforge.net/projects/hunyuanimage-3-0.mirror/. وقد استُضيف في OnWorks لتشغيله عبر الإنترنت بسهولة من أحد أنظمتنا التشغيلية المجانية.