Linux için Geri Bildirimli Talimatları İndirin

Bu, en son sürümü following-instructions-human-feedbacksourcecode.tar.gz olarak indirilebilen Following Instructions with Feedback adlı Linux uygulamasıdır. İş istasyonları için ücretsiz barındırma sağlayıcısı OnWorks'te çevrimiçi olarak çalıştırılabilir.

 
 

OnWorks ile Geri Bildirimli Talimatları Takip Etme adlı bu uygulamayı ücretsiz olarak çevrimiçi indirin ve çalıştırın.

Bu uygulamayı çalıştırmak için şu talimatları izleyin:

- 1. Bu uygulamayı PC'nize indirdiniz.

- 2. Dosya yöneticimize https://www.onworks.net/myfiles.php?username=XXXXX istediğiniz kullanıcı adını girin.

- 3. Bu uygulamayı böyle bir dosya yöneticisine yükleyin.

- 4. Bu web sitesinden OnWorks Linux çevrimiçi veya Windows çevrimiçi öykünücüsünü veya MACOS çevrimiçi öykünücüsünü başlatın.

- 5. Yeni başladığınız OnWorks Linux işletim sisteminden, istediğiniz kullanıcı adıyla https://www.onworks.net/myfiles.php?username=XXXXX dosya yöneticimize gidin.

- 6. Uygulamayı indirin, kurun ve çalıştırın.

EKRAN GÖRÜNTÜLERİ:


Geri Bildirimle Talimatları Takip Etme


AÇIKLAMA:

Takip edilen talimatlar-insan-geri bildirimi deposu, OpenAI'nin insan geri bildirimleriyle kullanıcı talimatlarını daha iyi takip eden dil modelleri (InstructGPT modelleri) eğitimindeki çalışmalarının temelini oluşturan kodu ve ek materyalleri içerir. Depo, model kartını, örnek otomatik değerlendirme çıktılarını ve süreçte kullanılan etiketleme yönergelerini barındırır. "İnsan geri bildirimleriyle talimatları takip etmek için dil modellerini eğitme" makalesine açıkça bağlıdır ve OpenAI'nin açıklama yönergelerini nasıl topladığı, tercih karşılaştırmaları nasıl çalıştırdığı ve model davranışlarını nasıl değerlendirdiği konusunda bir referans görevi görür. Depo, tüm RLHF işlem hattının tam bir uygulaması değil, yayınlanmış araştırmaları destekleyen ve değerlendirme ve insan etiketleme standartları konusunda şeffaflık sağlayan bir arşiv merkezidir. Automatic-eval-samples (kıyaslama görevlerindeki model çıktılarının örnekleri) ve InstructGPT modellerinin amaçlanan davranışını, sınırlamalarını ve önyargılarını açıklayan bir model-card.md gibi dizinler içerir.



Özellikler

  • InstructGPT deneylerinden değerlendirme örneği çıktılarının arşivi
  • model kullanımını, sınırlamaları ve güvenlik hususlarını açıklayan model-card.md
  • İnsan değerlendiriciler için kullanılan etiketleme yönergeleri / açıklama talimatları
  • Temel çıktı ile ince ayarlı çıktıları gösteren yapılandırılmış "automatic-eval-samples" klasörü
  • OpenAI'nin model tercihi sıralamasını ve hizalamasını nasıl ölçtüğü konusunda şeffaflık
  • Orijinal araştırma makalesine ve belgelere bağlantılar ve referanslar



Kategoriler

Eğitim

Bu uygulama, https://sourceforge.net/projects/following-inst-feedback.mirror/ adresinden de indirilebilir. Ücretsiz İşletim Sistemlerimizden birinden çevrimiçi olarak en kolay şekilde çalıştırılabilmesi için OnWorks'te barındırılmıştır.



En yeni Linux ve Windows çevrimiçi programları


Windows ve Linux için Yazılım ve Programları indirebileceğiniz kategoriler