Aceasta este aplicația Linux numită AlphaZero.jl a cărei ultimă versiune poate fi descărcată ca v0.5.4.zip. Poate fi rulat online în furnizorul de găzduire gratuit OnWorks pentru stații de lucru.
Descărcați și rulați online această aplicație numită AlphaZero.jl cu OnWorks gratuit.
Urmați aceste instrucțiuni pentru a rula această aplicație:
- 1. Ați descărcat această aplicație pe computer.
- 2. Introduceți în managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator pe care îl doriți.
- 3. Încărcați această aplicație într-un astfel de manager de fișiere.
- 4. Porniți emulatorul online OnWorks Linux sau Windows online sau emulatorul online MACOS de pe acest site web.
- 5. Din sistemul de operare OnWorks Linux pe care tocmai l-ați pornit, accesați managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator dorit.
- 6. Descărcați aplicația, instalați-o și rulați-o.
SCREENSHOTS
Ad
AlphaZero.jl
DESCRIERE
Dincolo de succesul mult mediatizat în atingerea nivelului supraomenesc la jocuri precum Chess and Go, algoritmul AlphaZero de la DeepMind ilustrează o metodologie mai generală de combinare a învățării și a căutării pentru a explora spații mari combinatorii în mod eficient. Credem că această metodologie poate avea aplicații interesante în multe domenii de cercetare diferite. Deoarece AlphaZero are nevoie de resurse, implementările de succes open-source (cum ar fi Leela Zero) sunt scrise în limbaje de nivel scăzut (cum ar fi C++) și optimizate pentru medii de calcul foarte distribuite. Acest lucru le face greu accesibile pentru studenți, cercetători și hackeri. Multe implementări simple Python pot fi găsite pe Github, dar niciuna dintre ele nu este capabilă să depășească o linie de bază rezonabilă în jocuri precum Othello sau Connect Four. Ca o ilustrare, benchmark-ul din README al celor mai populare dintre ele prezintă doar o linie de bază aleatoare, împreună cu o linie de bază lacomă care nu pare a fi semnificativ mai puternică.
Categorii
- Algoritmul de bază este de doar 2,000 de linii de cod Julia pur și hackabil
- Interfețele generice facilitează adăugarea de suport pentru jocuri noi sau cadre de învățare noi
- Între unu și două ordine de mărime mai rapid decât alternativele sale Python
- Această implementare permite rezolvarea de jocuri non-triviale pe un computer desktop standard cu un GPU
- Același agent poate fi instruit pe un grup de mașini la fel de ușor ca pe un singur computer și fără a modifica o singură linie de cod
- Mecanism de simulare asincron care permite trimiterea în lot a cererilor către rețeaua neuronală prin mai multe fire de simulare
Limbaj de programare
Julia
Categorii
Aceasta este o aplicație care poate fi preluată și de la https://sourceforge.net/projects/alphazero-jl.mirror/. A fost găzduit în OnWorks pentru a fi rulat online într-un mod cât mai ușor de pe unul dintre sistemele noastre operative gratuite.