To, co jest racjonalne w danym momencie, zależy od czterech rzeczy:
* Miara wydajności, która określa kryterium sukcesu.
* Uprzednia wiedza agenta o środowisku.
* Czynności, które agent może wykonać.
* Dotychczasowa sekwencja percepcji agenta.
Prowadzi to do definicji racjonalnego sprawcy:
Dla każdej możliwej sekwencji percepcji racjonalny agent powinien wybrać działanie, które powinno zmaksymalizować jego miarę wydajności, biorąc pod uwagę dowody dostarczone przez sekwencję percepcji i jakąkolwiek wbudowaną wiedzę agenta.
Rozważmy prosty środek do odkurzacza, który czyści kwadrat, jeśli jest brudny, i przenosi się na drugi kwadrat, jeśli nie .
Czy to racjonalny agent? To zależy! Najpierw musimy powiedzieć, czym jest miara wydajności, co wiadomo o środowisku oraz jakie czujniki i aktuatory posiada agent. Załóżmy, że:
* Miara wydajności przyznaje jeden punkt za każdy czysty kwadrat w każdym kroku czasowym, w „życiu” 1000 przedziałów czasowych.
*„Geografia” środowiska jest znana a priori (rysunek 2.2), ale nie jest znana dystrybucja brudu i początkowa lokalizacja agenta. Czyste kwadraty pozostają czyste, a ssanie czyści obecny kwadrat. Akcje Prawo i Lewo przesuwają agenta o jedno pole, chyba że spowoduje to wyniesienie agenta poza otoczenie, w którym to przypadku agent pozostaje tam, gdzie jest.
* Jedyne dostępne akcje to Prawo, Lewo i Ssanie.
* Agent prawidłowo rozpoznaje swoją lokalizację i czy ta lokalizacja zawiera brud.
W tych okolicznościach sprawca jest rzeczywiście racjonalny; jego oczekiwana wydajność jest co najmniej tak dobra, jak każdego innego agenta. Łatwo zauważyć, że ten sam agent byłby irracjonalny w różnych okolicznościach. Na przykład, gdy cały brud zostanie oczyszczony, środek będzie niepotrzebnie oscylował w tę i z powrotem; jeśli miara wydajności zawiera karę w wysokości jednego punktu za każdy ruch, agent poradzi sobie słabo. Lepszy środek do tego przypadku nic by nie zrobił, gdybyśmy mieli pewność, że wszystkie kwadraciki są czyste. Jeśli czyste kwadraty mogą się ponownie zabrudzić, środek powinien od czasu do czasu sprawdzać i w razie potrzeby ponownie je czyścić. Jeśli geografia środowiska jest nieznana, agent będzie musiał ją zbadać.