Preferencje bez niepewności

Zacznijmy od przypadku deterministycznego. Zauważyliśmy, że dla środowisk deterministycznych agent ma funkcję wartości, którą zapisujemy tutaj jako V(x1,…,xn); celem jest zwięzłe przedstawienie tej funkcji. Podstawową prawidłowością, która pojawia się w deterministycznych strukturach preferencji, jest niezależność preferencji. Dwa atrybuty X1 i X2 są preferencyjnie niezależne od trzeciego atrybutu X3, jeśli preferencja między wynikami <x1,x2x3> i <x’1 , x’2 , x’3> nie zależy od konkretnej wartości x3 atrybutu X3. Wracając do przykładu z lotniska, gdzie mamy do rozważenia (między innymi) Ciszę, Oszczędność i Bezpieczeństwo, można zasugerować, że Cisza i Oszczędność są preferencyjnie niezależne od Bezpieczeństwa. Na przykład, jeśli wolimy wynik z 20 000 osób przebywających na torze lotu i koszt budowy wynoszący 4 miliardy dolarów od wyniku z 70 000 osób przebywających na torze lotu i kosztem 3,7 miliarda dolarów, gdy poziom bezpieczeństwa wynosi 0,006 zgonów na miliard pasażerów mil w obu przypadkach mielibyśmy takie same preferencje, gdy poziom bezpieczeństwa wynosi 0,012 lub 0,003; ta sama niezależność zachowałaby preferencje między każdą inną parą wartości Ciszy i Oszczędności. Oczywiste jest również, że Oszczędność i Bezpieczeństwo są preferencyjnie niezależne od Ciszy i że Cisza i Bezpieczeństwo są preferencyjnie niezależne od Oszczędności. Mówimy, że zbiór atrybutów fQuietness;Frugality; Safetyg wykazuje wzajemną preferencyjną niezależność (MPI). MPI mówi, że chociaż każdy atrybut może być ważny, nie wpływa to na sposób, w jaki jeden z nich wymienia inne atrybuty ze sobą. Wzajemna preferencyjna niezależność to skomplikowana nazwa, ale prowadzi ona do prostej postaci funkcji wartości agenta: Jeśli atrybuty X1,…,Xn są wzajemnie preferencyjnie niezależne, to preferencje agenta mogą być reprezentowane przez funkcję wartości

gdzie każde Vi odnosi się tylko do atrybutu Xi. Na przykład może być tak, że decyzję na lotnisku można podjąć za pomocą funkcji wartości V(spokój; oszczędność; bezpieczeństwo) = spokój x 104+oszczędność+bezpieczeństwo x 1012 .

Funkcja wartości tego typu nazywana jest addytywną funkcją wartości. Funkcje addytywne są niezwykle naturalnym sposobem na opisanie preferencji agenta i sprawdzają się w wielu rzeczywistych sytuacjach. W przypadku n atrybutów ocena funkcji wartości addytywnej wymaga oceny n oddzielnych jednowymiarowych funkcji wartości zamiast jednej funkcji n-wymiarowej; zazwyczaj oznacza to wykładnicze zmniejszenie liczby potrzebnych eksperymentów dotyczących preferencji. Nawet jeśli MPI nie jest ściśle przestrzegane, co może mieć miejsce w przypadku skrajnych wartości atrybutów, funkcja wartości addytywnej może nadal zapewniać dobre przybliżenie preferencji agenta. Jest to szczególnie ważne, gdy naruszenia MPI występują w częściach zakresów atrybutów, które w praktyce są mało prawdopodobne. Aby lepiej zrozumieć MPI, warto przyjrzeć się przypadkom, w których się nie sprawdza. Załóżmy, że jesteś na średniowiecznym targu, rozważając zakup psów myśliwskich, kurczaków i wiklinowych klatek dla kurczaków. Psy myśliwskie są bardzo cenne, ale jeśli nie masz wystarczającej liczby klatek dla kurczaków, psy zjedzą kurczaki; w związku z tym kompromis między psami a kurczakami zależy w dużej mierze od liczby klatek, a MPI jest naruszone. Istnienie tego rodzaju interakcji między różnymi atrybutami znacznie utrudnia ocenę ogólnej funkcji wartości.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *