هذا هو تطبيق لينكس المسمى "متابعة التعليمات مع التغذية الراجعة"، ويمكن تنزيل أحدث إصدار منه بـ following-instructions-human-feedbacksourcecode.tar.gz. ويمكن تشغيله عبر الإنترنت من خلال موفر الاستضافة المجاني OnWorks لمحطات العمل.
قم بتنزيل وتشغيل هذا التطبيق المسمى Following Instructions with Feedback with OnWorks عبر الإنترنت مجانًا.
اتبع هذه التعليمات لتشغيل هذا التطبيق:
- 1. قم بتنزيل هذا التطبيق على جهاز الكمبيوتر الخاص بك.
- 2. أدخل في مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX باسم المستخدم الذي تريده.
- 3. تحميل هذا التطبيق في هذا الملف.
- 4. ابدأ تشغيل OnWorks Linux عبر الإنترنت أو محاكي Windows عبر الإنترنت أو محاكي MACOS عبر الإنترنت من هذا الموقع.
- 5. من نظام تشغيل OnWorks Linux الذي بدأته للتو ، انتقل إلى مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX مع اسم المستخدم الذي تريده.
- 6. قم بتنزيل التطبيق وتثبيته وتشغيله.
SCREENSHOTS
Ad
اتباع التعليمات مع التعليقات
الوصف
يحتوي مستودع "التوجيهات التالية والتغذية الراجعة البشرية" على الشيفرة البرمجية والمواد التكميلية التي تُشكل أساس عمل OpenAI في تدريب نماذج اللغة (نماذج InstructGPT) التي تتبع تعليمات المستخدم بشكل أفضل من خلال التغذية الراجعة البشرية. يستضيف المستودع بطاقة النموذج، وعينات من مخرجات التقييم التلقائي، وإرشادات الوسم المستخدمة في العملية. وهو مرتبط بشكل صريح بورقة "تدريب نماذج اللغة على اتباع التعليمات مع التغذية الراجعة البشرية"، ويُعدّ مرجعًا لكيفية جمع OpenAI لإرشادات التعليقات التوضيحية، وإجراء مقارنات التفضيلات، وتقييم سلوكيات النماذج. لا يُعدّ المستودع تطبيقًا كاملاً لخطة RLHF بأكملها، بل هو مركز أرشيفي يدعم الأبحاث المنشورة، مما يوفر شفافية حول معايير التقييم والتسمية البشرية. يتضمن المستودع أدلة مثل automatic-eval-samples (عينات من مخرجات النموذج في مهام المقارنة المعيارية) وmodel-card.md الذي يصف السلوك المقصود لنماذج InstructGPT، وقيودها، وتحيزاتها.
شرح المميزات:
- أرشيف مخرجات عينات التقييم من تجارب InstructGPT
- model-card.md يصف استخدام النموذج والقيود واعتبارات السلامة
- إرشادات وضع العلامات / تعليمات التوضيح المستخدمة للمقيمين البشريين
- مجلد "التقييم التلقائي للعينات" المنظم الذي يُظهر النتائج الأساسية مقابل النتائج المُحسّنة
- الشفافية حول كيفية قياس OpenAI لترتيب تفضيلات النموذج ومواءمته
- روابط ومراجع للبحث الأصلي والوثائق
التصنيفات
هذا تطبيق يُمكن تنزيله أيضًا من https://sourceforge.net/projects/following-inst-feedback.mirror/. وقد استُضيف في OnWorks لتشغيله عبر الإنترنت بسهولة من أحد أنظمتنا التشغيلية المجانية.
