Reprezentowanie problemu decyzyjnego za pomocą sieci decyzyjnej

W swojej najbardziej ogólnej formie sieć decyzyjna reprezentuje informacje o aktualnym stanie agenta, jego możliwych działaniach, stanie, który wyniknie z działania agenta oraz użyteczności tego stanu. Rysunek przedstawia sieć decyzyjną dla problemu lokalizacji lotniska. Ilustruje trzy rodzaje użytych węzłów:

* Węzły losowe (owale) reprezentują zmienne losowe, tak jak w sieciach bayesowskich. Agent może być niepewny co do kosztów budowy, poziomu ruchu lotniczego i możliwości wszczęcia postępowania sądowego oraz zmiennych dotyczących bezpieczeństwa, ciszy i całkowitej oszczędności, z których każda zależy również od wybranej lokalizacji. Każdy węzeł szansy ma skojarzony z nim rozkład warunkowy, który jest indeksowany stanem węzłów nadrzędnych. W sieciach decyzyjnych węzły nadrzędne mogą obejmować węzły decyzyjne, jak również węzły losowe. Należy zauważyć, że każdy z węzłów losowych w obecnym stanie może być częścią dużej sieci bayesowskiej do oceny kosztów budowy, poziomu ruchu lotniczego lub potencjału sądowego

* Węzły decyzyjne (prostokąty) reprezentują punkty, w których decydent ma wybór działań. W takim przypadku działanie AirportSite może przyjąć inną wartość dla każdej rozważanej witryny. Wybór wpływa na bezpieczeństwo, spokój i oszczędność rozwiązania. W tym rozdziale zakładamy, że mamy do czynienia z pojedynczym węzłem decyzyjnym.

* Węzły użyteczności (diamenty) reprezentują funkcję użyteczności agenta.7 Węzeł użyteczności ma jako rodzica wszystkie zmienne opisujące wyniki, które bezpośrednio wpływają na użyteczność. Z węzłem użyteczności powiązany jest opis użyteczności agenta jako funkcja atrybutów nadrzędnych. Opis może być po prostu tabelą funkcji lub może być sparametryzowaną addytywną lub liniową funkcją wartości atrybutów. Na razie założymy, że funkcja jest deterministyczna; to znaczy, biorąc pod uwagę wartości jego zmiennych nadrzędnych, wartość węzła użyteczności jest w pełni określona.

W wielu przypadkach stosowany jest również uproszczony formularz. Notacja pozostaje identyczna, ale węzły losowe opisujące stany wynikowe są pomijane. Zamiast tego węzeł użyteczności jest połączony bezpośrednio z węzłami stanu bieżącego i węzłem decyzyjnym. W tym przypadku, zamiast reprezentować funkcję użyteczności w stanach wynikowych, węzeł użyteczności reprezentuje oczekiwaną użyteczność powiązaną z każdym działaniem, jak zdefiniowano w Równaniu; oznacza to, że węzeł jest powiązany z funkcją działania-użyteczności (znaną również jako funkcja Q w uczeniu się przez wzmacnianie). Rysunek przedstawia reprezentację problemu lokalizacji lotniska w postaci narzędzia akcji. Zauważ, że ponieważ węzły szansy Cisza, Bezpieczeństwo i Oszczędność na rysunku odnoszą się do przyszłych stanów, ich wartości nigdy nie mogą być ustawione jako zmienne dowodowe.

Tak więc uproszczona wersja, która pomija te węzły, może być używana zawsze, gdy można użyć bardziej ogólnej formy. Chociaż uproszczona forma zawiera mniej węzłów, pominięcie jednoznacznego opisu wyniku decyzji lokalizacyjnej powoduje, że jest ona mniej elastyczna w odniesieniu do zmian okoliczności. Na przykład na rysunku powyżej zmiana poziomu hałasu statku powietrznego może zostać odzwierciedlona przez zmianę w tabeli prawdopodobieństwa warunkowego powiązanej z węzłem Cisza, podczas gdy zmiana wagi przypisanej do zanieczyszczenia hałasem w funkcji użyteczności może zostać odzwierciedlona przez zmianę w tabeli użytkowej. Z drugiej strony na diagramie użyteczności akcji /wszystkie takie zmiany muszą być odzwierciedlone przez zmiany w tabeli użyteczności akcji. Zasadniczo sformułowanie użytkowe jest skompilowaną wersją oryginalnego sformułowania, uzyskaną przez zsumowanie zmiennych stanu wynikowego.

Post Views: 133

Dodaj komentarz Anuluj pisanie odpowiedzi