Teoria gier

Istnieją co najmniej trzy stanowiska, które możemy przyjąć w stosunku do środowisk wieloagentowych. Pierwszym stanowiskiem, odpowiednim w przypadku bardzo dużej liczby podmiotów, jest rozważenie ich łącznie jako gospodarki, co pozwala nam na przewidywanie, że rosnący popyt spowoduje wzrost cen, bez konieczności przewidywania działania jakichkolwiek indywidualny agent. Po drugie, moglibyśmy traktować podmioty przeciwne tylko jako część środowiska – część, która sprawia, że ​​środowisko jest niedeterministyczne. Ale jeśli modelujemy przeciwników w taki sam sposób, w jaki, powiedzmy, deszcz czasami pada, a czasami nie, tracimy ideę, że nasi przeciwnicy aktywnie próbują nas pokonać, podczas gdy deszcz rzekomo nie ma takiego zamiaru. Trzecie stanowisko polega na wyraźnym modelowaniu przeciwników za pomocą technik przeszukiwania drzew przeciwnika. To właśnie obejmuje ten rozdział. Zaczynamy od ograniczonej klasy gier i definiujemy optymalny ruch oraz algorytm do jego znajdowania. Przeszukiwanie minimaksowe, uogólnienie przeszukiwania AND–OR. Pokazujemy, że przycinanie sprawia, że ​​wyszukiwanie jest bardziej wydajne, ignorując części drzewa wyszukiwania, które nie mają wpływu na optymalny ruch. W nietrywialnych grach zwykle nie mamy wystarczająco dużo czasu, aby znaleźć optymalny ruch (nawet przy przycinaniu); w pewnym momencie będziemy musieli przerwać poszukiwania. Dla każdego stanu, w którym postanowiliśmy przestać szukać, pytamy, kto wygrywa. Aby odpowiedzieć na to pytanie, mamy wybór: możemy zastosować heurystyczną funkcję oceny, aby oszacować, kto wygrywa na podstawie cech stanu, lub możemy uśrednić wyniki wielu szybkich symulacji gry z tego stanu wszystkie droga do końca . Omawiamy gry, które zawierają element losowy (poprzez rzucanie kośćmi lub tasowanie kart), i omawiamy gry z niedoskonałymi informacjami (takie jak poker i brydż, gdzie nie wszystkie karty są widoczne dla wszystkich graczy).

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *