GoGPT Best VPN GoSearch

온웍스 파비콘

Linux용 피드백 다운로드 지침 따르기

Ubuntu 온라인, Fedora 온라인 또는 Debian 온라인에서 온라인으로 실행하기 위한 Feedback Linux 앱이 포함된 다음 지침을 무료로 다운로드하세요.

이 앱은 Following Instructions with Feedback이라는 이름의 리눅스 앱으로, 최신 버전은 following-instructions-human-feedbacksourcecode.tar.gz 파일로 다운로드할 수 있습니다. 워크스테이션용 무료 호스팅 제공업체인 OnWorks에서 온라인으로 실행할 수 있습니다.

무료로 Following Instructions with Feedback with OnWorks라는 앱을 온라인에서 다운로드하여 실행해보세요.

이 앱을 실행하려면 다음 지침을 따르세요.

- 1. 이 애플리케이션을 PC에 다운로드했습니다.

- 2. 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX에 원하는 사용자 이름을 입력합니다.

- 3. 이러한 파일 관리자에서 이 응용 프로그램을 업로드합니다.

- 4. 이 웹사이트에서 OnWorks Linux 온라인 또는 Windows 온라인 에뮬레이터 또는 MACOS 온라인 에뮬레이터를 시작합니다.

- 5. 방금 시작한 OnWorks Linux OS에서 원하는 사용자 이름으로 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX로 이동합니다.

- 6. 응용 프로그램을 다운로드하여 설치하고 실행합니다.

스크린 샷

Ad


피드백을 통한 지침 따르기


기술

following-instructions-human-feedback 저장소에는 OpenAI가 사용자 피드백을 통해 사용자 지시를 더 잘 따르는 언어 모델(InstructGPT 모델)을 훈련하는 데 필요한 코드와 보충 자료가 포함되어 있습니다. 이 저장소는 모델 카드, 샘플 자동 평가 출력, 그리고 이 과정에 사용되는 레이블 지정 지침을 호스팅합니다. "인간 피드백을 통해 지시를 따르도록 언어 모델을 훈련하는 방법" 논문과 명시적으로 연계되어 있으며, OpenAI가 주석 지침을 수집하고, 선호도 비교를 실행하고, 모델 동작을 평가하는 방식에 대한 참고 자료 역할을 합니다. 이 저장소는 전체 RLHF 파이프라인을 완벽하게 구현한 것이 아니라, 발표된 연구를 지원하는 보관 허브로서 평가 및 인간 레이블 지정 표준에 대한 투명성을 제공합니다. 벤치마크 작업의 모델 출력 샘플인 automatic-eval-samples와 InstructGPT 모델의 의도된 동작, 한계 및 편향을 설명하는 model-card.md와 같은 디렉터리를 포함합니다.



기능

  • InstructGPT 실험의 평가 샘플 출력 보관소
  • 모델 사용, 제한 사항 및 안전 고려 사항을 설명하는 model-card.md
  • 인간 평가자를 위해 사용되는 라벨링 지침/주석 지침
  • 기준선과 미세 조정된 출력을 보여주는 구조화된 "자동 평가 샘플" 폴더
  • OpenAI가 모델 선호도 순위 및 정렬을 측정하는 방법에 대한 투명성
  • 원본 연구 논문 및 문서에 대한 링크 및 참조



카테고리

교육

이 애플리케이션은 https://sourceforge.net/projects/following-inst-feedback.mirror/에서도 다운로드할 수 있습니다. OnWorks에 호스팅되어 무료 운영 체제 중 하나에서 가장 쉽게 온라인에서 실행할 수 있도록 설계되었습니다.


무료 서버 및 워크스테이션

Windows 및 Linux 앱 다운로드

Linux 명령

Ad




×
광고
❤️여기에서 쇼핑, 예약, 구매하세요. 비용이 들지 않아 서비스를 무료로 유지하는 데 도움이 됩니다.