Wydajna reprezentacja rozkładów warunkowych

Nawet jeśli maksymalna liczba rodziców jest niewielka, wypełnienie CPT dla węzła wymaga maksymalnie O(2k) liczb i być może dużego doświadczenia ze wszystkimi możliwymi przypadkami warunkowania. W rzeczywistości jest to najgorszy scenariusz, w którym relacja między rodzicami a dzieckiem jest całkowicie arbitralna. Zazwyczaj takie relacje można opisać za pomocą rozkładu kanonicznego, który pasuje do jakiegoś standardowego wzorca. W takich przypadkach kompletną tabelę można określić po prostu przez nazwanie wzorca i być może podanie kilku parametrów. Najprostszym przykładem są węzły deterministyczne. Węzeł deterministyczny ma swoją wartość dokładnie określoną przez wartości jego rodziców, bez niepewności. Związek może być logiczny: na przykład związek między węzłami nadrzędnymi Kanada, Stany Zjednoczone, Meksyk i węzłem potomnym North American polega po prostu na tym, że dziecko jest alternatywą rodziców. Zależność może być również liczbowa: na przykład najlepsza praktyka dotycząca samochodu to minimalna cena u każdego dealera w okolicy; a WaterStored w zbiorniku na koniec roku to suma pierwotnej ilości plus dopływy (rzeki, spływ, opady) i minus odpływy (uwalnianie, parowanie, przesiąkanie).

Wiele systemów sieciowych Bayesa umożliwia użytkownikowi określenie funkcji deterministycznych przy użyciu języka programowania ogólnego przeznaczenia; umożliwia to uwzględnienie w modelu probabilistycznym złożonych elementów, takich jak globalne modele klimatu lub symulatory sieci energetycznej. Innym ważnym wzorcem, który często występuje w praktyce, jest niezależność kontekstowa lub CSI. Rozkład warunkowy wykazuje CSI, jeśli zmienna jest warunkowo niezależna od niektórych swoich rodziców przy określonych wartościach innych. Załóżmy na przykład, że uszkodzenie samochodu w danym okresie zależy od wytrzymałości samochodu i tego, czy w tym okresie miał miejsce wypadek. Oczywiście, jeśli wypadek jest fałszywy, to ewentualne uszkodzenie nie zależy od wytrzymałości twojego samochodu. (Może dojść do uszkodzenia lakieru lub szyb samochodu w wyniku aktów wandalizmu, ale zakładamy, że wszystkie samochody są w równym stopniu narażone na takie uszkodzenia.) Mówimy, że Uszkodzenie jest kontekstowo niezależne od Wytrzymałości, biorąc pod uwagę Wypadek= false . Systemy sieciowe Bayesa często implementują CSI przy użyciu składni ifthen-else do określania dystrybucji warunkowych; na przykład można napisać

gdzie d1 i d2 reprezentują dowolne rozkłady. Podobnie jak w przypadku determinizmu, obecność CSI w sieci może ułatwić efektywne wnioskowanie. Wszystkie dokładne algorytmy wnioskowania można zmodyfikować, aby wykorzystać CSI do przyspieszenia obliczeń. Niepewne relacje często charakteryzują się tak zwanymi zaszumionymi relacjami logicznymi. Standardowym przykładem jest relacja noisy-OR, która jest uogólnieniem logicznego OR. W logice zdań możemy powiedzieć, że gorączka jest prawdziwa wtedy i tylko wtedy, gdy prawdziwe są przeziębienie, grypa lub malaria. Model noisy-OR pozwala na niepewność co do zdolności każdego rodzica do spowodowania, że dziecko jest prawdziwe – związek przyczynowy między rodzicem a dzieckiem może być zahamowany, a więc pacjent może być przeziębiony, ale nie ma gorączki.

Model przyjmuje dwa założenia. Po pierwsze, zakłada, że wymienione są wszystkie możliwe przyczyny. (Jeśli niektórych brakuje, zawsze możemy dodać tak zwany węzeł przecieku, który obejmuje „różne przyczyny”). Po drugie, zakłada, że hamowanie każdego z rodziców jest niezależne od hamowania jakichkolwiek innych rodziców: na przykład cokolwiek powstrzymuje malarię przed wywoływaniem gorączka jest niezależna od tego, co powstrzymuje grypę przed wywołaniem gorączki. Biorąc pod uwagę te założenia, gorączka jest fałszywa wtedy i tylko wtedy, gdy wszyscy jej prawdziwi rodzice są zahamowani, a prawdopodobieństwo tego jest iloczynem prawdopodobieństw zahamowania qj dla każdego rodzica. Załóżmy, że te indywidualne prawdopodobieństwa hamowania są następujące:

Następnie, na podstawie tych informacji i założeń z zaszumionym OR, można zbudować cały CPT. Ogólna zasada jest taka, że

gdzie produkt jest przejmowany przez rodziców ustawionych jako prawda dla tego wiersza CPT. Rysunek  ilustruje to obliczenie

Ogólnie rzecz biorąc, zaszumione relacje logiczne, w których zmienna zależy od k rodziców, można opisać za pomocą parametrów O(k) zamiast O(2k) dla pełnej tablicy prawdopodobieństwa warunkowego. To znacznie ułatwia ocenę i uczenie się. Na przykład sieć CPCS (Pradhan i in., 1994) wykorzystuje rozkłady zaszumiony OR i zaszumiony MAX do modelowania relacji między chorobami i objawami w medycynie wewnętrznej. Przy 448 węzłach i 906 łączach wymaga tylko 8254 parametrów zamiast 133 931 430 dla sieci z pełnymi CPT.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *