Druga możliwość jest taka, że inni aktorzy w środowisku są również decydentami: każdy z nich ma preferencje i wybiera i realizuje swój własny plan. Nazywamy je odpowiednikami. W tym przypadku możemy wyróżnić dwie dalsze możliwości.
- Po pierwsze, chociaż jest wielu decydentów, wszyscy oni dążą do wspólnego celu. Jest to z grubsza sytuacja pracowników w firmie, w której różni decydenci dążą, miejmy nadzieję, do tych samych celów w imieniu firmy. Głównym problemem, z jakim borykają się decydenci w tej sytuacji, jest problem z koordynacją: problem, który muszą zapewnić, aby wszyscy podążali w tym samym kierunku i aby przypadkowo nie pokrzyżować swoich planów.
- Druga możliwość polega na tym, że każdy z decydentów ma swoje osobiste preferencje, do których każdy będzie dążył najlepiej, jak potrafi. Możliwe, że preferencje są diametralnie przeciwstawne, jak ma to miejsce w grach o sumie zerowej, takich jak szachy. Ale większość spotkań wieloagentowych jest bardziej skomplikowana, z bardziej złożonymi preferencjami.
Gdy istnieje wielu decydentów, z których każdy dąży do własnych preferencji, agent musi brać pod uwagę preferencje innych podmiotów, a także fakt, że ci inni agenci biorą również pod uwagę preferencje innych podmiotów i tak dalej. To przenosi nas w sferę teorii gier: teorii podejmowania strategicznych decyzji. To właśnie ten strategiczny aspekt rozumowania – każdy z graczy bierze pod uwagę sposób, w jaki mogą działać inni gracze – odróżnia teorię gier od teorii decyzji. W ten sam sposób, w jaki teoria decyzji zapewnia teoretyczną podstawę podejmowania decyzji w SI z jednym agentem, teoria gier zapewnia teoretyczną podstawę podejmowania decyzji w systemach wieloagentowych. Użycie tutaj słowa „gra” również nie jest idealne: naturalny wniosek jest taki, że teoria gier dotyczy głównie zajęć rekreacyjnych lub sztucznych scenariuszy. Nic nie może być dalej od prawdy. Teoria gier to teoria podejmowania strategicznych decyzji. Jest on używany w sytuacjach decyzyjnych, w tym przy licytacji praw do odwiertów ropy naftowej i praw do bezprzewodowego widma częstotliwości, postępowaniach upadłościowych, opracowywaniu produktów i decyzjach cenowych oraz w obronie narodowej – sytuacjach, w których płaci się miliardy dolarów i wiele istnień ludzkich. Teorię gier w AI można wykorzystać na dwa główne sposoby:
- Projektowanie agentów: Teoria gier może być wykorzystywana przez agenta do analizowania możliwych decyzji i obliczania oczekiwanej użyteczności dla każdej z nich (przy założeniu, że inni agenci działają racjonalnie, zgodnie z teorią gier). W ten sposób techniki teorii gier mogą określić najlepszą strategię przeciwko racjonalnemu graczowi i oczekiwany zwrot dla każdego gracza.
- Projektowanie mechanizmu: gdy środowisko jest zamieszkane przez wielu agentów, może być możliwe zdefiniowanie reguł środowiska (tj. gry, w którą muszą grać agenci), tak aby wspólne dobro wszystkich agentów było maksymalizowane, gdy każdy agent przyjmuje rozwiązanie oparte na teorii gier, które maksymalizuje swoją użyteczność. Na przykład teoria gier może pomóc zaprojektować protokoły dla zbioru routerów ruchu internetowego, tak aby każdy router miał motywację do działania w taki sposób, aby zmaksymalizować globalną przepustowość. Konstrukcja mechanizmu może być również wykorzystana do budowy inteligentnych systemów wieloagentowych, które rozwiązują złożone problemy w sposób rozproszony.
Teoria gier dostarcza szeregu różnych modeli, z których każdy ma własny zestaw podstawowych założeń; ważne jest, aby dobrać odpowiedni model do każdego ustawienia. Najważniejszym rozróżnieniem jest to, czy powinniśmy uważać to za grę kooperacyjną, czy nie:
- W grze kooperacyjnej możliwe jest zawarcie wiążącej umowy między agentami, co umożliwia solidną współpracę. W ludzkim świecie umowy prawne i normy społeczne pomagają w ustanawianiu takich wiążących umów. W świecie programów komputerowych możliwe jest sprawdzenie kodu źródłowego, aby upewnić się, że będzie on zgodny z umową. My wykorzystamy teorię gier kooperacyjnych do analizy tej sytuacji.
- Jeżeli wiążące umowy nie są możliwe, prowadzimy grę niekooperacyjną. Chociaż termin ten sugeruje, że gra jest z natury konkurencyjna i że współpraca nie jest możliwa, nie musi tak być: brak współpracy oznacza po prostu, że nie ma centralnego porozumienia wiążącego wszystkich agentów i gwarantującego współpracę. Ale równie dobrze może się zdarzyć, że agenci niezależnie zdecydują się na współpracę, ponieważ leży to w ich własnym interesie. Do analizy tej sytuacji używamy teorii gier niekooperacyjnych.
Niektóre środowiska będą łączyć wiele różnych wymiarów. Na przykład firma kurierska może codziennie planować scentralizowane, offline trasy swoich ciężarówek i samolotów, ale pozostawiać pewne aspekty otwarte dla autonomicznych decyzji kierowców i pilotów, którzy mogą indywidualnie reagować na sytuacje drogowe i pogodowe. Również cele firmy i jej pracowników są do pewnego stopnia uzgadniane przez wypłatę premii (pensje i premie) – pewny znak, że jest to prawdziwy system wieloagentowy.