Dynamiczne sieci bayesowskie

Dynamiczne sieci bayesowskie (DBNs) rozszerzają semantykę standardowych sieci bayesowskich, aby obsłużyć modele prawdopodobieństwa czasowego . Widzieliśmy już przykłady DBN: sieć parasolową i sieć filtrów Kalmana. Ogólnie rzecz biorąc, każdy wycinek DBN może mieć dowolną liczbę zmiennych stanu Xt i zmiennych dowodowych Σt . Dla uproszczenia zakładamy, że zmienne, ich połączenia i ich rozkłady warunkowe są dokładnie replikowane w każdym wycinku oraz że DBN reprezentuje proces Markowa pierwszego rzędu, tak że każda zmienna może mieć rodziców tylko we własnym wycinku lub w poprzedzający kawałek. W ten sposób DBN odpowiada sieci bayesowskiej z nieskończenie wieloma zmiennymi. Powinno być jasne, że każdy ukryty model Markowa może być reprezentowany jako DBN z pojedynczej zmiennej stanu i pojedyncza zmienna dowodowa. Jest również tak, że każdy dyskretny DBN może być reprezentowany jako HMM; jak wyjaśniono w rozdziale 14.3, możemy połączyć wszystkie zmienne stanu w DBN w jedną zmienną stanu, której wartości są wszystkimi możliwymi krotkami wartości poszczególnych zmiennych stanu. Teraz, jeśli każdy HMM jest DBN i każdy DBN można przetłumaczyć na HMM, jaka jest różnica? Różnica polega na tym, że rozkładając stan złożonego systemu na jego zmienne składowe, możemy wykorzystać rzadkość w modelu prawdopodobieństwa czasowego. Aby zobaczyć, co to oznacza w praktyce, pamiętaj, że w sekcji 14.3 powiedzieliśmy, że reprezentacja HMM dla procesu czasowego z n zmiennymi dyskretnymi, każda z wartościami do d, wymaga macierzy przejścia o rozmiarze O(d2n). Z drugiej strony reprezentacja DBN ma rozmiar O(ndk), jeśli liczba rodziców każdej zmiennej jest ograniczona przez k. Innymi słowy, reprezentacja DBN jest liniowa, a nie wykładnicza pod względem liczby zmiennych. W przypadku robota próżniowego z 42 potencjalnie brudnymi lokalizacjami liczba wymaganych prawdopodobieństw zmniejsza się z 5 x 1029 do kilku tysięcy. Wyjaśniliśmy już, że każdy model filtra Kalmana może być reprezentowany w DBN za pomocą zmiennych ciągłych i rozkładów warunkowych liniowo-gaussowskich (rysunek 14.9). Z dyskusji na końcu poprzedniej sekcji powinno jasno wynikać, że nie każdy DBN może być reprezentowany przez model filtra Kalmana. W filtrze Kalmana bieżący rozkład stanu jest zawsze pojedynczym wielowymiarowym rozkładem Gaussa — to znaczy pojedynczym „wybrzuszeniem” w określonej lokalizacji. Z drugiej strony DBN mogą modelować dowolne rozkłady. W wielu rzeczywistych zastosowaniach ta elastyczność jest niezbędna. Rozważmy na przykład aktualną lokalizację moich kluczy. Mogą być w mojej kieszeni, na stoliku nocnym, na kuchennym blacie, zwisają z drzwi wejściowych lub zamknięte w samochodzie. Pojedynczy guz Gaussa, obejmujący wszystkie te miejsca, musiałby oznaczać znaczne prawdopodobieństwo, że klucze znajdują się w powietrzu nad frontowym ogrodem. Aspekty świata rzeczywistego, takie jak czynniki celowe, przeszkody i kieszenie, wprowadzają „nieliniowości”, które wymagają kombinacji zmiennych dyskretnych i ciągłych w celu uzyskania rozsądnych modeli.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *