PaLM + RLHF - Pytorch라는 이름의 리눅스 앱으로, 최신 릴리스는 0.5.4sourcecode.tar.gz로 다운로드할 수 있습니다. 워크스테이션용 무료 호스팅 제공업체인 OnWorks에서 온라인으로 실행할 수 있습니다.
PaLM + RLHF - Pytorch with OnWorks라는 앱을 무료로 다운로드하여 온라인에서 실행해보세요.
이 앱을 실행하려면 다음 지침을 따르세요.
- 1. 이 애플리케이션을 PC에 다운로드했습니다.
- 2. 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX에 원하는 사용자 이름을 입력합니다.
- 3. 이러한 파일 관리자에서 이 응용 프로그램을 업로드합니다.
- 4. 이 웹사이트에서 OnWorks Linux 온라인 또는 Windows 온라인 에뮬레이터 또는 MACOS 온라인 에뮬레이터를 시작합니다.
- 5. 방금 시작한 OnWorks Linux OS에서 원하는 사용자 이름으로 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX로 이동합니다.
- 6. 응용 프로그램을 다운로드하여 설치하고 실행합니다.
스크린 샷
Ad
PaLM + RLHF - 파이토치
기술
PaLM-rlhf-pytorch는 인간 피드백을 기반으로 한 강화 학습(RLHF)을 기반으로 하는 Pathways Language Model(PaLM)의 PyTorch 구현입니다. OpenAI가 ChatGPT와 같은 모델을 학습하는 방식과 유사하게, 인간의 선호도에 맞춰 대규모 언어 모델을 미세 조정하도록 설계되었습니다.
기능
- 대규모 언어 모델을 미세 조정하기 위한 RLHF 구현
- 강화 학습 안정성을 위해 PPO(Proximal Policy Optimization)를 사용합니다.
- GPU 및 TPU와 같은 분산 하드웨어에서의 학습을 위해 최적화됨
- 사전 학습과 보상 모델 미세 조정을 모두 지원합니다.
- 모듈식 및 확장 가능한 구성 요소를 갖춘 PyTorch 기반
- 인간 중심의 AI 훈련 실험을 위해 설계되었습니다.
프로그래밍 언어
Python
카테고리
이 애플리케이션은 https://sourceforge.net/projects/palm-rlhf-pytorch.mirror/에서도 다운로드할 수 있습니다. OnWorks에 호스팅되어 무료 운영 체제 중 하나에서 가장 쉽게 온라인에서 실행할 수 있습니다.