Wiedza o aktualnym stanie środowiska nie zawsze wystarcza do podjęcia decyzji, co zrobić. Na przykład na skrzyżowaniu dróg taksówka może skręcić w lewo, skręcić w prawo lub jechać prosto. Właściwa decyzja zależy od tego, dokąd próbuje dojechać taksówka. Innymi słowy, oprócz opisu stanu bieżącego agent potrzebuje pewnego rodzaju informacji o celu, które opisują pożądane sytuacje, na przykład bycie w określonym miejscu docelowym. Program agenta może połączyć to z modelem (te same informacje, które zostały użyte w agencie odruchowym opartym na modelu), aby wybrać działania, które osiągają cel. Rysunek przedstawia strukturę agenta opartego na celu.
Czasami wybór działania na podstawie celu jest prosty — na przykład, gdy satysfakcja z celu wynika natychmiast z pojedynczego działania. Czasami będzie to trudniejsze – na przykład, gdy agent musi rozważyć długie sekwencje zwrotów akcji, aby znaleźć sposób na osiągnięcie celu. Wyszukiwanie i planowanie to podpola AI poświęcone znajdowaniu sekwencji działań, które osiągają cele agenta. Zauważ, że tego rodzaju podejmowanie decyzji różni się zasadniczo od opisanych wcześniej reguł warunku-działania, ponieważ wymaga rozważenia przyszłości: „Co się stanie, jeśli zrobię to a to?”. i „Czy to mnie uszczęśliwi?” W projektach agentów odruchów ta informacja nie jest jawnie reprezentowana, ponieważ wbudowane reguły mapują bezpośrednio z perceptów na akcje. Środek odruchowy hamuje, gdy widzi światła stopu, kropka. Nie ma pojęcia dlaczego. Agent nastawiony na cel hamuje, gdy widzi światła hamowania, ponieważ jest to jedyne działanie, które przewiduje, że osiągnie cel, jakim jest nie uderzenie w inne samochody. Chociaż agent zorientowany na cel wydaje się mniej wydajny, jest bardziej elastyczny, ponieważ wiedza, która wspiera jego decyzje, jest jawnie reprezentowana i może być modyfikowana. Na przykład zachowanie agenta opartego na celu można łatwo zmienić, aby przejść do innego miejsca docelowego, po prostu określając to miejsce docelowe jako cel. Zasady agenta odruchów dotyczące tego, kiedy skręcić, a kiedy jechać prosto, będą działać tylko w jednym miejscu; trzeba je wszystkie wymienić, aby móc udać się w nowe miejsce.