AI : Technologie, Aplikacje i Wyzwania : Projekt architektury proponowanego agenta szachowego przy użyciu sieci SARSA

https://aie24.pl/

Systemem wybranym do tworzenia i testowania agenta szachowego jest sieć SARSA [7], która realizuje koncepcję przeszukiwania drzewa Monte Carlo (MCTS). W tym przypadku sieć SARSA wdraża koncepcje uczenia się przez wzmacnianie jako technikę on-policy. Technika on-policy odnosi się do modelu RL, który uczy się swojej polityki, gdy wchodzi w interakcję ze środowiskiem, więc interakcja i uczenie się agenta z otoczeniem zachodzą jednocześnie. Architekturę proponowanego agenta szachowego przedstawiono na rysunku .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *