Wzmacnianie uczenia (RL) to raczkująca metoda tworzenia oprogramowania do gier sztucznej inteligencji (AI). W RL agent (gracz) może zbadać wszystkie możliwe sposoby poruszania się w środowisku. Dla każdej akcji wykonanej przez agenta następuje przejście z bieżącego stanu do innego stanu. Zgodnie z akcją przyznawana jest nagroda. Kiedy agent wykonuje dobry ruch, otrzymuje wysoką nagrodę, podczas gdy robi zły ruch, otrzymuje niską nagrodę. Więc agent stara się uzyskać wysoką nagrodę, wykonując dobre ruchy. Ta metoda może być używana do tworzenia oprogramowania do gier.