Nauka struktur sieciowych Bayesa

https://aie24.pl/

Do tej pory zakładaliśmy, że struktura sieci Bayesa jest podana i próbujemy tylko nauczyć się parametrów. Struktura sieci reprezentuje podstawową wiedzę przyczynową na temat domeny, którą ekspert, a nawet naiwny użytkownik może łatwo dostarczyć. Jednak w niektórych przypadkach model przyczynowy może być niedostępny lub podlegać dyskusji – na przykład niektóre korporacje od dawna twierdzą, że palenie nie powoduje raka, a inne korporacje twierdzą, że stężenie CO2 nie ma wpływu na klimat – dlatego ważne jest, aby zrozumieć jak na podstawie danych można nauczyć się struktury sieci Bayesa. Ta sekcja zawiera krótki szkic głównych pomysłów. Najbardziej oczywistym podejściem jest poszukiwanie dobrego modelu. Możemy zacząć od modelu nie zawierającego linków i rozpocząć dodawanie rodziców dla każdego węzła, dopasowując parametry do metod, które właśnie omówiliśmy i mierząc dokładność wynikowego modelu. Alternatywnie, możemy zacząć od wstępnego zgadywania konstrukcji i użyć wspinaczki lub symulowanego wyszukiwania wyżarzania, aby dokonać modyfikacji, dostrajając parametry po każdej zmianie w konstrukcji. Modyfikacje mogą obejmować odwracanie, dodawanie lub usuwanie łączy. Nie wolno nam wprowadzać cykli w procesie, więc wiele algorytmów zakłada, że ​​dla zmiennych podane jest porządkowanie i że węzeł może mieć rodziców tylko wśród tych węzłów, które pojawiają się wcześniej w porządkowaniu  . Dla pełnej ogólności musimy też przeszukać możliwe zamówienia. Istnieją dwie alternatywne metody decydowania o znalezieniu dobrej struktury. Pierwszym z nich jest sprawdzenie, czy warunkowe zapewnienia niezależności zawarte w strukturze są rzeczywiście spełnione w danych. Na przykład użycie naiwnego modelu Bayesa dla problemu restauracji zakłada, że:

P(Głodny,Bar |WillWait) = P(Głodny|WillWait)P(Bar | WillWait)

i możemy sprawdzić w danych, czy to samo równanie zachodzi między odpowiednimi częstotliwościami warunkowymi. Ale nawet jeśli struktura opisuje prawdziwą przyczynową naturę dziedziny, statystyczne fluktuacje w zbiorze danych oznaczają, że równanie nigdy nie zostanie dokładnie spełnione, więc musimy przeprowadzić odpowiedni test statystyczny, aby sprawdzić, czy istnieją wystarczające dowody na to, że hipoteza niezależności zostało naruszone. Złożoność powstałej sieci będzie zależeć od progu zastosowanego w tym teście — im bardziej rygorystyczny test niezależności, tym więcej dodanych łączy i tym większe niebezpieczeństwo przepełnienia. Podejściem bardziej zgodnym z pomysłami zawartymi w tym rozdziale jest ocena stopnia, w jakim proponowany model wyjaśnia dane (w sensie probabilistycznym). Musimy jednak uważać, jak to mierzymy. Jeśli spróbujemy znaleźć hipotezę maksymalnego prawdopodobieństwa, otrzymamy w pełni połączoną sieć, ponieważ dodanie większej liczby rodziców do węzła nie może zmniejszyć prawdopodobieństwa (Ćwiczenie 21.MLPA). Jesteśmy zmuszeni w pewien sposób karać złożoność modelu. Podejście MAP (lub MDL) po prostu odejmuje karę od prawdopodobieństwa każdej struktury (po dostrojeniu parametrów) przed porównaniem różnych struktur. Podejście bayesowskie stawia wspólne pierwszeństwo nad strukturami i parametrami. Zazwyczaj jest zbyt wiele struktur, aby można je było zsumować (superwykładniczy w liczbie zmiennych), więc większość praktyków używa MCMC do próbkowania struktur. Penalizowanie złożoności (czy to metodą MAP, czy metodą bayesowską) wprowadza ważny związek pomiędzy optymalną strukturą a charakterem reprezentacji dla rozkładów warunkowych w sieci. W przypadku rozkładów tabelarycznych kara złożoności dla rozkładu węzła rośnie wykładniczo wraz z liczbą rodziców, ale w przypadku, powiedzmy, zaszumionych rozkładów OR, rośnie tylko liniowo. Oznacza to, że uczenie się za pomocą modeli z zaszumionym OR (lub innymi zwartymi parametrami) ma tendencję do tworzenia wyuczonych struktur z większą liczbą rodziców niż uczenie się z rozkładami tabelarycznymi.

AI : Technologie, Aplikacje i Wyzwania : Zaangażowanie poznawcze, behawioralne i emocjonalne

https://aie24.pl/

Zaangażowanie poznawcze jest szeroko akceptowaną koncepcją w uczeniu się w klasie lub podobnej konfiguracji . Zaangażowanie poznawcze ma kluczowe znaczenie dla zrozumienia motywacji do interakcji z danym wirtualnym środowiskiem, ponieważ określa stan procesów myślowych i uczuć, które są kluczowe dla zdrowia psychicznego i dobrego samopoczucia w dowolnym punkcie interakcji. W warunkach klasowych zaangażowanie poznawcze jest operacjonalizowane poprzez pomiar wysiłku indywidualnego ucznia w zakresie wykonywania zadań, obecności na zajęciach, udziału w zajęciach pozalekcyjnych i zaangażowania w dyskusje w klasie . Kiedy to zaangażowanie jest postrzegane w kontekście złożonej tematyki wraz z zaangażowaniem innego agenta, projektem instrukcji, poczuciem sprawstwa i autonomią przypisywaną zaangażowaniu poznawczemu uczniów , wtedy jest operacjonalizowany jako miara złożonej zależności między jednostką (taką jak zdolność do myślenia, uczestniczenia i zamiar uczenia się) oraz kontekst sytuacyjny, w którym ma miejsce uczenie się lub interakcja . Autonomia i poczucie sprawczości mają kluczowe znaczenie dla zaangażowania poznawczego. Autonomię definiuje się jako stan korzystania z niezależności i samostanowienia . Sprawczość definiuje się jako korzystanie ze zdolności do działania, a poczucie sprawczości odnosi się do poczucia kontroli nad działaniem . Poczucie sprawstwa można wyjaśnić modelem sprzężenia zwrotnego kontroli motorycznej . Model sprzężenia zwrotnego działa w pętli danych wejściowych sprzężenia do przodu i sprzężenia zwrotnego, w której agent porównuje przewidywaną i zamierzoną trajektorię ruchu, a także przewidywaną i rzeczywistą trajektorię ruchu. Konsekwentne porównanie przewidywanego i zamierzonego działania oraz przewidywanego i rzeczywistego rezultatu pomaga dostroić ruchy ciała do efektywnej interakcji ze środowiskiem . Oczywiste jest, że w modelu sprzężenia zwrotnego-komparatora kontyngencja sensomotoryczna jest kluczem, który odgrywa kluczową rolę w konstruowaniu immersji. Poczucie sprawstwa jest ściśle związane z doświadczeniem przepływu . Przepływ to stan umysłu, który prowadzi do doświadczenia głębokiej przyjemności i zaabsorbowania zadaniem . Doświadczenie przepływu wiąże się ze zdrowiem psychicznym i dobrym samopoczuciem oraz ma pozytywny wpływ na sesje terapeutyczne i rehabilitacyjne, sprzyjając znaczącym zmianom w codziennym życiu pacjenta . Badania wykazały, że to przepływ wysiłku w porównaniu z przepływem bez wysiłku daje poczucie sprawczości. Może to wynikać z różnicy w przetwarzaniu automatycznym i kontrolowanym. Wysiłkowe procesy uwagi wymagają świadomego wyboru przewidywań i porównań, jak sugeruje model sprzężenia zwrotnego, aby umożliwić lepsze poczucie sprawstwa. Poczucie sprawstwa jest niezbędne w prawie każdej sesji terapeutycznej, w której dąży się do aktywnego udziału pacjentów . Sesja terapeutyczna ma na celu zmotywowanie pacjentów do osiągnięcia poczucia sprawstwa, szczególnie w przypadku dużego zaburzenia depresyjnego (MDD) . Poczucie sprawstwa pomaga rozwinąć poczucie skuteczności, wiarę jednostki i pewność co do możliwości osiągnięcia pożądanego celu. W przypadku MDD negatywne myśli o sobie, świecie i przyszłości wiążą się z poczuciem sprawstwa i poczuciem skuteczności (Beck, 2008). Utrata zdolności przewidywania i planowania przyszłości, nieumiejętność wiary w osiągnięcie upragnionego celu, poczucie bezradności rozwijają utratę poczucia sprawstwa i ostatecznie utratę poczucia skuteczności. Kilka innych powszechnie omawianych zaburzeń klinicznych, które wykazały różny stopień poczucia sprawstwa i poczucia skuteczności, to schizofrenia , fobia oraz urojenia , wskazując na znaczenie poczucia sprawstwa w dobrym leczeniu tych pacjentów. Zaangażowanie behawioralne odnosi się do bardziej wyraźnej ewaluacji zorientowanej na działanie , w której uczniowie są obserwowani, gdy czytają na głos i angażują się w dyskusje z rówieśnikami i nauczycielem z uczniami w klasie. Zaangażowanie emocjonalne odnosi się do doświadczania przyjemnego lub nieprzyjemnego oraz wysokiego lub niskiego pobudzenia umysłu podczas uczenia się. Skuteczne wykonanie dowolnego zadania i kontynuowanie go z nieustanną motywacją wymaga korelacji między doświadczeniami poznawczymi, behawioralnymi i afektywnymi.  Badania kliniczne VR mogą wykorzystywać te miary do spełnienia czterech celów badań klinicznych VR: opisu objawów, przyczynowych wyjaśnień zaburzeń, przewidywania i leczenia. Jednym z głównych sposobów, w jaki VR może osiągnąć obiektywny pomiar zaangażowania, jest śledzenie głowy VR. Śledzenie głowy, emocje i uwaga. Możliwość śledzenia ruchów ciała i głowy w HMD VR może potencjalnie mierzyć zaangażowanie poznawcze, zachowanie i afektywne podczas interakcji z dynamicznym otoczeniem 360°. Ta sekcja koncentruje się na środkach śledzenia głowy. Parametry śledzenia głowy obejmują ruchy odchylenia, pochylenia i przechyłu. Ruch z boku na bok wzdłuż osi y jest zdefiniowany jako zbaczanie, ruch góra-dół wzdłuż osi x jako pochylenie, a ruch przechyłu w kierunku barku wzdłuż osi z jako przechylenie. Badanie przeprowadzone przez Lin badające reakcje lękowe w VR oceniło strategie samopomocy, unikania i podejścia do radzenia sobie. Samopomoc / rozmowa z samym sobą obejmuje krzyki, przeklinanie lub autosugestię, aby się uspokoić; strategia podejścia obejmuje konfrontację z bodźcami zagrożenia i aktywną wirtualną eksplorację; strategia unikania obejmuje mentalne wyłączenie (np. przeorientowanie myśli lub uwagi na coś innego przy użyciu strategii rozpraszania) i/lub fizyczne wyłączenie (np. zamknięcie oczu lub odsunięcie się od bodźców) (Lin, 2017). Badanie wykazało, że uczestnicy stosujący strategię unikania zgłaszali zamykanie oczu lub oddalanie się od bodźca poprzez zmianę orientacji głowy na trzech osiach: y, x i z . Co ciekawe, Lin  poinformował, że jego iluzja wiarygodności (PSI) w porównaniu do iluzji miejsca (PI), która przyczyniła się do reakcji strachu, zwłaszcza tych, którzy stosowali strategię unikania. Badanie Lin (2017) sugeruje, że pomiar iluzji miejsca nie wystarczy do zrozumienia wpływu interakcji z wirtualnym środowiskiem na zdrowie psychiczne. Wskazuje również, że uczestnicy z różnymi strategiami poznawczymi wykazują różnice w zaangażowaniu poznawczym (wychwytywanie uwagi i aktywne skanowanie otoczenia kontra ograniczanie zakresu skupienia uwagi), zaangażowanie behawioralne (zamykanie oczu lub odsuwanie głowy i ciała od bodźców zagrażających) oraz zaangażowanie emocjonalne (uczucie negatywnego pobudzenia w porównaniu z pozytywnym pobudzeniem) podczas interakcji z bodźcami strachu w HMD VR. Inne badanie badające związek między doświadczeniem afektywnym a śledzeniem głowy podczas eksploracji filmów 360° prezentowanych przy użyciu HMD VR wykazało pozytywną korelację między doświadczeniem afektywnym a ruchem głowy. Li i inni zaobserwowali wyższe odchylenie standardowe ruchu odchylenia, gdy uczestnicy zgłaszali doświadczanie przyjemnego uczucia w porównaniu z nieprzyjemnym uczuciem. Ponadto zaobserwowali wyższy ruch tonu, gdy uczestnicy zgłaszali doświadczanie wysokiego w porównaniu z niskim pobudzeniem. Badanie z mojej grupy zaobserwowało podobny wzorzec wraz z wyższą prędkością kątową ruchu zbaczania, gdy uczestnicy zgłaszali przyjemne uczucie w porównaniu do nieprzyjemnego, co sugeruje objęcie szerszym obszarem eksploracji podczas przyjemnego doświadczenia niż nieprzyjemnego doświadczenia (rękopis przed złożeniem). Li i inni wyniki można wyjaśnić teorią emocji typu „poszerz i zbuduj”. Można zasugerować, że stan przyjemny w porównaniu do nieprzyjemnego moduluje zakres uwagi i motywuje obserwatora/widza do poszukiwania większej ilości informacji. Szerszy zakres uwagi i poszukiwanie większej ilości informacji może być wspierany przez szerszą wirtualną eksplorację czasoprzestrzenną. Poszerzający się aspekt teorii pozytywnych emocji sugeruje, że emocja moduluje zakres uwagi i pozwala na szersze lub węższe skupienie uwagi, w zależności od indywidualnego stanu emocjonalnego. Szerszy zakres uwagi pozwala bardziej rozproszonej/niezogniskowanej uwagi na uzyskanie większej ilości informacji w porównaniu z negatywnym stanem umysłu, który zawęża skupienie uwagi i ogranicza skanowanie do ograniczonej właściwości obiektu/zdarzenia . Aspekt budowlany teorii emocji sugeruje, że stan przyjemny w porównaniu z nieprzyjemnym zwiększa motywację do poszukiwania większej ilości informacji i zachęca do większego działania . Dzięki doświadczeniu VR aspekt budowania można ocenić poprzez większą eksplorację podczas doświadczenia VR, a popędy i motywację do wykonywania większej liczby zadań lub aktywności w codziennych scenariuszach można ocenić jako doświadczenie po VR. Uwaga i stan afektywny mogą modulować doświadczenie przepływu i poczucie sprawstwa oraz mogą wpływać na reakcję jednostki na bodziec VR. Pozytywny stan umysłu zwiększa poczucie własności i kontroli nad własną decyzją, oceną lub jakimikolwiek innymi działaniami . Dlatego ważne jest, aby używać pomiarów VR wraz z obserwacjami klinicznymi i samoopisem, aby ocenić zaangażowanie poznawcze, behawioralne i afektywne, aby zwiększyć poczucie sprawstwa i doświadczenie przepływu, aby osiągnąć bardziej ukierunkowane na cel zachowanie.

Bayesowska regresja liniowa

https://aie24.pl/

Tutaj ilustrujemy, jak zastosować podejście bayesowskie do standardowego zadania statystycznego: regresji liniowej. Konwencjonalne podejście zostało opisane jako minimalizacja sumy kwadratów błędów i ponownie zinterpretowane jako maksymalizacja prawdopodobieństwa przy założeniu modelu błędu Gaussa. Dają one jedną najlepszą hipotezę: linię prostą z określonymi wartościami nachylenia i przecięcia oraz stałą wariancję błędu przewidywania w dowolnym punkcie. Nie ma miary tego, jak pewnie należy być w wartościach nachylenia i przecięcia. Ponadto, jeśli prognozuje się wartość dla niewidocznego punktu danych daleko od obserwowanych punktów danych, wydaje się nie ma sensu zakładanie błędu prognozy, który jest taki sam, jak błąd prognozy dla punktu danych tuż obok obserwowanego punktu danych . Wydaje się bardziej rozsądne, aby błąd przewidywania był większy, im dalej punkt danych znajduje się od obserwowanych danych, ponieważ mała zmiana nachylenia spowoduje dużą zmianę przewidywanej wartości dla odległego punktu. Podejście bayesowskie rozwiązuje oba te problemy. Ogólną ideą, podobnie jak w poprzedniej sekcji, jest umieszczenie a priori na parametrach modelu – tutaj współczynniki modelu liniowego i wariancji szumu – a następnie obliczenie a posteriori parametru na podstawie danych. W przypadku danych wielowymiarowych i modelu nieznanego szumu prowadzi to do dość dużej ilości algebry liniowej, więc skupiamy się na prostym przypadku: dane jednozmienne, model, który jest ograniczony do przechodzenia przez źródło, oraz znany szum: rozkład normalny z wariancją σ2. Wtedy mamy tylko jeden parametr θ, a model to

Ponieważ logarytm prawdopodobieństwa jest kwadratowy w θ , odpowiednia forma sprzężenia poprzedzającego θ jest również gaussowski. Gwarantuje to, że tył dla będzie również gaussowski. Przyjmiemy średnią 0 i wariancję 2 0 dla poprzedniego, więc ponieważ logarytm prawdopodobieństwa w θ jest kwadratowy, odpowiednią formą sprzężenia poprzedzającego θ jest również forma gaussowska. Gwarantuje to, że tył dla będzie również gaussowski. Przyjmiemy średnią θ0 i wariancję σ20 dla poprzedniego, więc

W zależności od modelowanych danych można mieć pewne wyobrażenie, jakiego rodzaju nachylenia θ można się spodziewać, lub można być całkowicie agnostycznym. W tym drugim przypadku sensowne jest wybranie θ0 jako 0 i σ20 jako dużego – tak zwana nieinformacyjna a priori. Na koniec możemy założyć wcześniejsze P(x) dla wartości x każdego punktu danych, ale jest to całkowicie nieistotne dla analizy, ponieważ nie zależy od θ. Teraz konfiguracja jest zakończona, więc możemy obliczyć a posteriori za pomocą równania (21.1): P(θ|d)  P(d|θ)P(θ). Obserwowane punkty danych to d=(x1,y1); …, (xN.yN), więc prawdopodobieństwo dla danych uzyskuje się z równania  w następujący sposób:

gdzie zaabsorbowaliśmy a priori wartości x i stałe normalizacyjne dla N Gaussów w stałą α, która jest niezależna od θ . Teraz łączymy to z parametrem poprzedzającym z równania , aby otrzymać a posteriori:

Chociaż wygląda to na skomplikowane, każdy wykładnik jest funkcją kwadratową θ , więc suma dwóch wykładników też jest taka sama. Stąd całe wyrażenie reprezentuje rozkład Gaussa dla θ. Używając manipulacji algebraicznych bardzo podobnych do tych w rozdziale, stwierdzamy:

ze „zaktualizowaną” średnią i wariancją podaną przez

Spójrzmy na te formuły, aby zobaczyć, co one oznaczają. Gdy dane są wąsko skoncentrowane na małym obszarze osi x w pobliżu początku, Σx2i będzie małe, a wariancja tylna σ2N będzie duża, mniej więcej równa wcześniejszej wariancji σ20. Spodziewaj się: dane w niewielkim stopniu ograniczają obrót linii wokół początku. I odwrotnie, gdy dane są szeroko rozłożone wzdłuż osi, Σx2i będzie duże, a tylna wariancja σ2N będzie mała, w przybliżeniu równa σ2/( Σx2i), więc nachylenie będzie bardzo ściśle ograniczone.

Aby dokonać prognozy w określonym punkcie danych, musimy zintegrować możliwe wartości θ, zgodnie z sugestią równania

Ponownie, suma dwóch wykładników jest funkcją kwadratową θ , więc mamy gaussowski θ, którego całka wynosi 1. Pozostałe wyrazy w y tworzą inny gaussowski:

Patrząc na to wyrażenie, widzimy, że przewidywana średnia dla y to θNx, to znaczy jest oparta na średniej a posteriori dla θ . Wariancja predykcji jest określona przez szum modelu σ2 plus człon proporcjonalny do x2, co oznacza, że odchylenie standardowe predykcji rośnie asymptotycznie liniowo wraz z odległością od początku. Jak zauważono na początku tej sekcji, większa niepewność prognoz, które są dalej od obserwowanych punktów danych, ma sens.

AI : Technologie, Aplikacje i Wyzwania : Rzeczywistość wirtualna i pokrewne miary

https://aie24.pl/

Wraz z rozwojem urządzeń HMD VR, dziś możemy używać HMD z wbudowanym eye-trackingiem (np. FOVE, Tobii z eye-trackingiem, i HTCvive eye-pro) i możemy synchronizować HMD VR z urządzeniami do monitorowania fizjologicznego , a także korzystać z pomiarów head-trackingu . Stosowanie wielu środków, takich jak śledzenie oczu i monitorowanie fizjologiczne wraz z danymi z śledzenia głowy, pomogłoby nam ocenić przetwarzanie poznawcze, takie jak uwaga, poprzez ocenę ich skupienia lub zakresu uwagi; strategie psychologiczne/poznawcze, takie jak strategia podejścia lub strategia unikania; pamięć; oraz strach i inne reakcje emocjonalne bardziej ilościowo i obiektywnie. Ostatnie 20 lat badań klinicznych nad VR położyło podwaliny pod przyszłe badania i stworzyło zapotrzebowanie na bardziej ustandaryzowane ustawienia VR, protokoły eksperymentów i metody obserwacji. Wielokrotne pomiary w badaniach VR poprawiłyby poznawcze interpretacje zaburzeń psychicznych. W tej sekcji omówimy znaczenie środków poznawczych, biologicznych i śledzenia głowy w kontekście badań klinicznych.

Mierniki poznawcze i biologiczne

  • Pomiary poznawcze

Ocena zaangażowania poznawczego i jego braku będzie ważnym krokiem w badaniach klinicznych VR, ponieważ pomoże zrozumieć zdolność pacjentów do postrzegania, uczestniczenia, konstruowania pamięci, podejmowania decyzji, rozwijania siebie i empatii oraz regulowania emocji. Badania badające związek między depresją a uwagą wykazały stronnicze przetwarzanie uwagi  oraz słabą kontrolę uwagi . Badania oceniające związek między lękiem a uwagą wykazały stronnicze rozmieszczenie uwagi w odpowiedzi na bodźce zagrażające. Ponadto techniki modyfikacji tendencyjności uwagi zostały użyte do modulowania tendencyjności uwagi w takich przypadkach klinicznych i wykazały zachęcające wyniki . Jednak badania nad psychozą donoszą o zmienionym stanie poznania, percepcji, osobowości, rzeczywistości czasowej i zmienione poczucie ucieleśnienia. W przeciwieństwie do tradycyjnych ocen i pomiarów psychiatrycznych, badania nad procesami poznawczymi leżącymi u podstaw zaburzeń psychicznych wykazały różnice w ruchu gałek ocznych podczas skanowania miejsca, w którym pacjenci cierpią na lęk  lub depresję , żeby wymienić tylko kilka. Analiza przetwarzania poznawczego za pomocą metod śledzenia wzroku w VR nie tylko przyniesie korzyści w zrozumieniu mechanizmów poznawczych różnych zaburzeń psychicznych podczas interakcji z dynamicznymi, złożonymi scenariuszami z życia codziennego, ale również wesprze rozwój poznawczych czynników ryzyka lub markerów poznawczych. Identyfikacja poznawczych/psychologicznych czynników ryzyka biomarkerów w praktykach zdrowia fizycznego może pomóc w zapobieganiu lub opóźnianiu wystąpienia co najmniej kilku zaburzeń, takich jak depresja lub lęk.

  • Środki biologiczne

Badanie zaangażowania poznawczego i mechanizmów poznawczych ma ogromny potencjał w zakresie lepszego zrozumienia zaburzeń psychicznych. Jednak nigdy nie byłaby to pełna historia bez wsparcia biologicznych korelatów. Przyjrzyjmy się przypadkom depresji klinicznej i lęku. Badania nad mózgowymi korelacjami depresji pokazują zmiany w aktywności ciała migdałowatego wraz z bodźcami emocjonalnymi, gdy są prezentowane na ekranie wyświetlacza fMRI , co wskazuje na stronnicze przetwarzanie afektywne. Badanie fMRI dotyczące percepcji ciała wykazało różnicę w aktywności wyspy w porównaniu ze zdrowym uczestnikiem grupy kontrolnej, co sugeruje, że zmieniona aktywność wyspy jest związana z nieprawidłowym „materialnym ja” pacjentów z MDD i nieprawidłowościami somatyczno-wegetatywnymi . Większa aktywność w bocznej korze przedczołowej i przednim zakręcie obręczy w mózgu z depresją podczas wykonywania zadania n-back (pomiar obciążenia pamięci roboczej) sugeruje, że potrzeba więcej wysiłku, aby osiągnąć ten sam poziom doskonałości, co zdrowi dorośli (Harvey i in., 2005). . Badania analizujące biologiczne korelaty ruminacji w przypadku depresji wykazały wyraźne różnice w sieci trybów domyślnych (DMN) w porównaniu ze zdrowym mózgiem dorosłego człowieka . Porównanie DMN między zdrowymi dorosłymi a pacjentami z ciężkimi zaburzeniami depresyjnymi (MDD) wykazało zwiększoną aktywność i łączność w podkolanowej przedniej korze zakrętu obręczy oraz brak zmniejszenia aktywności w brzuszno-przyśrodkowej korze przedczołowej, przednim zakręcie obręczy, bocznej korze ciemieniowej i bocznej korze skroniowej. W skrócie, sugeruje to, że niezdolność do obniżenia aktywności DMN jest odpowiedzialna za depresyjne przeżuwanie. Badania nad mózgowymi korelacjami zaburzeń lękowych wykazały zmniejszoną aktywację podkolanowej przedniej kory zakrętu obręczy, gdy uczestnicy oglądali bodźce lękowe po zakończeniu sesji warunkowania strachem . Niespokojny mózg wykazywał różnice w aktywacji w brzuszno-przyśrodkowej korze przedczołowej wraz z wiekiem, zgłaszając większą zwiększoną aktywność u nastolatków w porównaniu z pacjentami w starszym wieku . Pacjenci z zaburzeniami lękowymi wykazali różnicę w regionach DMN, które są krytyczne dla przetwarzania emocjonalnego. Niespokojny mózg wykazał stosunkowo mniejszą dezaktywację w przyśrodkowej korze przedczołowej i większą dezaktywację w tylnym zakręcie obręczy reagującym na zmieniony stan przetwarzania emocjonalnego . Badania kliniczne VR mogą wykorzystywać projekt pre-post do pomiaru biologicznych korelatów i DMN pacjentów i zdrowych dorosłych mózgów, aby nauczyć się zdolności adaptacyjnych i plastyczności po określonej interwencji. W przyszłości badania kliniczne VR powinny również wykorzystywać klasyczne testy poznawcze i odpowiadające im pomiary korelacji mózgowej, aby pokazać wpływ wysoce immersyjnej interakcji VR na mózg i reakcje behawioralne. Krótko mówiąc, badania kliniczne VR muszą obejmować wiele środków, od środków psychofizycznych i psychofizjologicznych po śledzenie wzroku do korelatów mózgu, wraz z oceną kliniczną i samoopisem pacjenta w celu opracowania holistycznego i złożonego zrozumienia biopsychospołecznego danego zaburzenia psychicznego. Poniższe sekcje skupiają się na znaczeniu studiowania zaangażowania poznawczego i podkreślają wykorzystanie narzędzi śledzenia głowy VR w celu zrozumienia poznawczego, behawioralnego i emocjonalnego zaangażowania w badaniach klinicznych VR.

Nauka parametrów bayesowskich

https://aie24.pl/

Uczenie się z maksymalnym prawdopodobieństwem daje początek prostym procedurom, ale ma poważne wady w przypadku małych zbiorów danych. Na przykład, po zobaczeniu jednego cukierka wiśniowego, hipoteza maksymalnego prawdopodobieństwa jest taka, że ​​torebka jest w 100% wiśniowa (tj.θ=1.0). O ile czyjaś hipoteza z góry nie głosi, że torebki muszą być całkowicie wiśniowe lub całkowicie limonkowe, nie jest to rozsądny wniosek. Bardziej prawdopodobne jest, że torebka jest mieszanką limonki i wiśni. Bayesowskie podejście do uczenia się parametrów rozpoczyna się od wcześniejszej hipotezy i aktualizuje rozkład w miarę napływania danych. Przykład cukierka na rysunku (a) ma jeden parametr θ : prawdopodobieństwo, że losowo wybrany kawałek cukierka ma smak wiśniowy.

W ujęciu bayesowskim θ jest (nieznaną) wartością zmiennej losowej Θ, która definiuje przestrzeń hipotez; hipoteza uprzednia jest wcześniejszym rozkładem nad P(Θ). Zatem P(Θ=θ ) jest prawdopodobieństwem a priori, że torebka zawiera ułamek θ cukierków wiśniowych. Jeżeli parametr θ może mieć dowolną wartość z zakresu od 0 do 1, to P(Θ) jest funkcją gęstości prawdopodobieństwa ciągłego (patrz Rozdział A.3). Jeśli nie wiemy nic o możliwych wartościach θ, możemy użyć funkcji jednorodnej gęstości P(θ ) = Uniform( θ;0;1), która mówi, że wszystkie wartości są równie prawdopodobne. Bardziej elastyczna rodzina funkcji gęstości prawdopodobieństwa jest znana jako rozkłady beta. Każdy rozkład beta jest zdefiniowany przez dwa hiperparametry a i b takie, że

dla θ w zakresie [0,1]. Stała normalizacji , która powoduje całkowanie rozkładu do 1, zależy od a i b.  Średnia wartość rozkładu beta wynosi a/(a+b), więc większe wartości a sugerują przekonanie, że Θ jest bliższe 1 niż 0. Większe wartości a+b powodują, że rozkład jest bardziej pikantny, co sugeruje większą pewność o wartości Q. Okazuje się, że funkcja jednorodnej gęstości jest taka sama jak Beta(1,;1): średnia wynosi 1/2, a rozkład jest płaski. Oprócz elastyczności, rodzina beta ma jeszcze jedną cudowną właściwość: jeśli Θ ma wcześniejszą Beta(a,b), to po zaobserwowaniu punktu danych rozkład a posteriori dla Θ jest również rozkładem beta. Innymi słowy, beta jest zamknięta w ramach aktualizacji. Rodzina beta nazywana jest sprzężoną sprzężoną wcześniejszą przed rodziną rozkładów dla zmiennej logicznej. Zobaczmy, jak to działa. Załóżmy, że obserwujemy cukierka wiśniowego; Następnie mamy

Tak więc po obejrzeniu cukierka wiśniowego po prostu zwiększamy parametr a, aby uzyskać a posteriori; podobnie po obejrzeniu cukierka z limonką zwiększamy parametr b. W ten sposób możemy postrzegać hiperparametry a i b jako wirtualne liczby, w tym sensie, że wcześniejsza beta(a,b) zachowuje się dokładnie tak, jak gdybyśmy zaczęli z jednorodną wcześniejszą beta (1,1) i widzieli a-1 rzeczywistą cukierki wiśniowe i b-1 rzeczywiste cukierki z limonki. Badając sekwencję rozkładów beta dla rosnących wartości a i b, zachowując stałe proporcje, możemy wyraźnie zobaczyć, jak rozkład a posteriori nad parametrem Θ zmienia się w miarę napływu danych. Załóżmy na przykład, że rzeczywista torebka cukierków to 75% wiśni. Rysunek (b) przedstawia sekwencję Beta(3,1), Beta(6,2), Beta(30,10).

Najwyraźniej rozkład zbliża się do wąskiego szczytu wokół prawdziwej wartości Q. W przypadku dużych zbiorów danych uczenie bayesowskie (przynajmniej w tym przypadku) zbiega się do tej samej odpowiedzi, co uczenie o maksymalnym prawdopodobieństwie. Rozważmy teraz bardziej skomplikowany przypadek. Sieć na rysunku (b) ma trzy parametry, θ, θ1 i θ2, gdzie 1 to prawdopodobieństwo czerwonego opakowania cukierka wiśniowego, a 2 to prawdopodobieństwo czerwonego opakowania cukierka z limonką. Uprzednia hipoteza bayesowska musi obejmować wszystkie trzy parametry, czyli musimy określić P(Θ;Θ12). Zazwyczaj zakładamy niezależność parametrów:

Przy takim założeniu każdy parametr może mieć własną dystrybucję beta, która jest aktualizowana oddzielnie w miarę napływania danych. Rysunek  pokazuje, jak możemy włączyć wcześniejszą hipotezę i dowolne dane do sieci bayesowskiej, w której mamy węzeł dla każdej zmiennej parametru.

Węzły Θ;Θ12 nie mają rodziców. Dla i-tej obserwacji opakowania i odpowiadającego mu smaku cukierka dodajemy węzły Wrapperi i Flavori. Flavori jest zależny od parametru smaku Θ:

Wrapperi  jest zależne od Θ1 i Θ2:

Teraz cały proces uczenia bayesowskiego dla oryginalnej sieci Bayesa na rysunku (b) można sformułować jako problem wnioskowania w pochodnej sieci Bayesa, gdzie dane i parametry stają się węzłami. Po dodaniu wszystkich nowych węzłów dowodowych możemy wykonać zapytanie o zmienne parametrów (w tym przypadku Θ;Θ12). Pod tym sformułowaniem znajduje się J tylko jeden algorytm uczenia się – algorytm wnioskowania dla sieci bayesowskich. Oczywiście natura tych sieci różni się nieco od tych opisanych w rozdziale 13 z powodu potencjalnie ogromnej liczby zmiennych dowodowych reprezentujących zbiór uczący oraz przewagi zmiennych parametrów o wartościach ciągłych. Dokładne wnioskowanie może być niemożliwe z wyjątkiem bardzo prostych przypadków, takich jak naiwny model Bayesa. Praktycy zazwyczaj stosują przybliżone metody wnioskowania, takie jak MCMC; wiele pakietów oprogramowania statystycznego zawiera w tym celu wydajne implementacje MCMC.

XYZ CyberBezpieki : Atak wstrzykiwania XML

Jeśli chodzi o wstrzykiwanie XML, najpierw omówmy dane wejściowe formularza, które zwykle można zobaczyć na stronie internetowej. Wpisz rozmiar tekstu 20, nazwa równa się nazwie użytkownika i wprowadź nazwę użytkownika. To co? Cóż, jest to strona internetowa, na której prosi się kogoś o podanie nazwy użytkownika. Kod bazowy, ciąg zapytania wyszukiwania LDAP jest równy nazwie pospolitej lub CN plus system nazwy użytkownika. Daje im dodatkowy kod. Ciąg znaków przekazywany z przeglądarki internetowej to coś w rodzaju Mike jako nazwa użytkownika, a hasło to Mike123. Cóż, wstrzyknięcie XML to technika ataku, która manipuluje logiką aplikacji lub usługi XML. Może być używany do wstrzykiwania XML do instrukcji, która zmienia ścieżkę do pliku w celu ujawnienia poufnych informacji jako przykład. Na przykład wstawiamy ścieżkę do konkretnego pliku. Następnie staramy się, aby to wróciło. Następnie chcemy zobaczyć, jaka jest zawartość pliku config.init. Jeśli nasza strona nie jest odpowiednio wykonana i skonstruowana prawidłowo i nie pozwala na różne rodzaje danych wejściowych, możemy osiągnąć bardzo wiele niezamierzonych wyników. Dlatego ważne jest, aby upewnić się, że odpowiednio ustrukturyzowaliśmy nasz kod, od samego początku pamiętamy o bezpieczeństwie i odpowiednio dezynfekujemy. Zezwalamy tylko na dane wejściowe, których chcemy.

AI : Technologie, Aplikacje i Wyzwania : Badania kliniczne w wirtualnej rzeczywistości

https://aie24.pl/

Wysoce wciągające HMD VR wydaje się potencjalnym rozwiązaniem do badania osób z zaburzeniami psychicznymi z perspektywy biopsychospołecznej. Zanim przejdziemy dalej, powinniśmy zastanowić się nad jednym z najistotniejszych pytań, które ta dziedzina badań powinna rozwiązać, a mianowicie, w jaki sposób HMD VR zrewolucjonizuje badania kliniczne i praktyki. Wysoce wciągające urządzenia VR, jak opisano we wcześniejszej sekcji, oferują więcej czasu rzeczywistego . Perspektywa Gestalt, w której pacjent proszony jest o uświadomienie sobie swoich myśli, zachowań, doświadczeń i uczuć oraz o przyjęcie odpowiedzialności za te reakcje . W przeciwieństwie do tradycyjnych praktyk, które opierają się na zdolności pacjentów do wyobrażania sobie i używania pamięci, VR pozwala im doświadczać symulowanego środowiska i wchodzić w interakcje z wirtualnymi obiektami. Ułatwia to podwyższoną świadomość ich myśli, zachowań, doświadczeń i uczuć. VR pozwala klinicystom tworzyć symulacje zbliżone do prawdziwego życia, które z różnych powodów mogą być trudne do stworzenia w inny sposób. Umożliwia śledzenie ruchów głowy i ciała odpowiadających dynamicznym zmianom w środowisku wirtualnym oraz pozwala lekarzom kontrolować i manipulować ustawieniami środowiskowymi zgodnie z profilem pacjenta. Klinicznie kontrolowane obserwacje VR umożliwiają klinicystom prowadzenie powtarzających się sesji o stopniowanej złożoności i pomagają w ocenie odpowiedzi poznawczych, emocjonalnych i sensomotorycznych lub psychomotorycznych (Garrett i in., 2018). W przeciwieństwie do tradycyjnych badań i praktyk klinicznych, badania nad zdrowiem psychicznym VR mogą obejmować następujące cztery główne cele przy użyciu bardziej dynamicznych symulacji rzeczywistych, aby uzyskać całościowy obraz danego zaburzenia psychicznego. Te cztery cele to: (a) ocena i opis objawów; (b) testowalne, domniemane przyczyny zaburzenia; (c) przewidywania i identyfikacja czynników ryzyka lub markerów biologicznych/społecznych/psychologicznych; oraz (d) metody leczenia w celu kontroli lub interwencji mającej na celu opóźnienie wystąpienia zaburzenia. Na przykład możemy opisać objawy depresji jako wszechobecny i utrzymujący się niski nastrój, niską samoocenę i anhedonię (DSM-V) (American Psychiatric Association, 2013). Objawy te można wyjaśnić jednym lub wieloma czynnikami, w tym relacjami biologicznymi, poznawczymi, psychologicznymi, naukowymi, behawioralnymi, społecznymi i interpersonalnymi. Biopsychospołeczne rozumienie przyczyn prowadziłoby do lepszego przewidywania czynników ryzyka depresji lub pomogłoby w opracowaniu biologicznych i poznawczych lub psychologicznych markerów depresji, co dodatkowo pomaga kontrolować początek depresji lub pomaga w zarządzaniu nią za pomocą bardziej skutecznych interwencji psychoterapeutycznych (Collins i in., 2011; Schacter i in., 2009). W przeważającej mierze większość badań VR skupiała się na leczeniu, kilka koncentrowało się na ocenie, a mniej badało przyczyny przyczynowe i pracowało nad teoretycznym rozwojem zaburzeń psychicznych . W badaniach nad psychoterapeutycznym leczeniem klinicznym VR zastosowano głównie trzy metody: terapię ekspozycyjną (narażenie pacjentów na stopniowane warunki środowiskowe i umożliwienie systematycznej konfrontacji bodźców zewnętrznych lub wewnętrznych w celu odczulenia sensorycznego, habituacji i zaszczepiania stresem, np. PTSD, fobia) , terapia dystrakcyjna (pomaga pacjentowi oderwać uwagę od stresujących bodźców i przeorientować uwagę na coś przyjemnego, aby zmniejszyć ból lub dyskomfort, np. ból, stres emocjonalny)  oraz trening (koncentracja na uważności, ćwiczenia oddechowe, techniki relaksacyjne, zaangażowanie społeczne, umiejętności interpersonalne, strategie poznawcze, np. uważna medytacja) . Istnieje kilka zaburzeń psychicznych, które były głównym przedmiotem badań nad mentalnością VR, takie jak PTSD , lęk , psychoza  zaburzenia uzależnień  oraz zaburzenia odżywiania. Jednak zaburzenia, takie jak depresja, które są powszechne i zgłaszane jako jedna z głównych przyczyn zgonów i prób samobójczych , były rzadko badane . Wyniki ostatnich 20 lat badań klinicznych nad VR są zachęcające i wykazały znaczny transfer uczenia się wirtualnego do rzeczywistego świata, wskazując, że HMD VR może nie być tylko potencjalną humanitarną alternatywą dla sesji klinicznych; może zastąpić tradycyjne praktyki kliniczne w wielu przypadkach klinicznych. Należy zauważyć, że immersja VR i poczucie obecności są szeroko stosowane w badaniach klinicznych VR, które pozwalają użytkownikom/pacjentom doświadczyć bogatego, inkluzywnego otoczenia 360° i korzystać z rozbudowanych, czuciowo-ruchowych, zależnych kontroli, odpowiadających doświadczaniu rzeczywistej percepcji poprzez naturalny ruch . Jednak jeśli chodzi o pomiary, badania kliniczne VR nie mogły wykorzystać pełnego potencjału obiektywnych miar VR. Pomiary VR, takie jak head-tracking, mogą pomóc w uzyskaniu bardziej obiektywnych i ilościowych danych, wraz z badaniami klinicznymi i subiektywnymi raportami. Badania kliniczne VR wykorzystywały głównie samoopis i obserwacje kliniczne. W badaniach wykorzystujących terapię ekspozycji VR w leczeniu lęku , PTSD , PTSD z użyciem Bravemind  oraz akrofobii  – kwestionariusze post samoopisowe dotyczące lęku i unikania , skala PTSD podawana przez klinicystę (CAPS) , wojskowa wersja listy kontrolnej PTSD (PCL-M), Inwentarz Lęku Becka ( BAI), kwestionariusz zdrowia pacjenta (PHQ) , kwestionariusz interpretacji wzrostu (HIQ), kwestionariusz akrofobii, kwestionariusz poprawy dostępu do terapii psychologicznej (IAPT) wraz z kwestionariuszem tendencji samobójczych i choroby symulatorowej (SSQ) . Podobne obserwacje poczyniono w przypadku rozkojarzeń VR i treningów VR. Chociaż badania te mogą odnieść sukces w przeniesieniu wirtualnego doświadczenia do rzeczywistego świata, badania te nadal ograniczają się do wykorzystania najnowszych ram oceny zdrowia psychicznego i dobrostanu oraz protokołów leczenia z wykorzystaniem perspektywy biopsychospołecznej.

Uczenie parametrów maksymalnego prawdopodobieństwa: modele ciągłe

https://aie24.pl/

Ponieważ zmienne ciągłe są wszechobecne w rzeczywistych zastosowaniach, ważne jest, aby wiedzieć, jak uczyć się parametrów modeli ciągłych z danych. Zasady uczenia się z maksymalnym prawdopodobieństwem są identyczne w przypadkach ciągłych i dyskretnych. Zacznijmy od bardzo prostego przypadku: poznania parametrów funkcji gęstości Gaussa na pojedynczej zmiennej. Oznacza to, że zakładamy, że dane są generowane w następujący sposób:

Parametrami tego modelu są średnia μ i odchylenie standardowe σ. (Zauważ, że normalizująca „stała” zależy od , więc nie możemy jej zignorować.) Niech obserwowane wartości będą równe x1,…,xN. Wtedy prawdopodobieństwo logarytmu wynosi

Ustawiając pochodne na zero jak zwykle otrzymujemy

Oznacza to, że maksymalna wartość prawdopodobieństwa średniej jest średnią próbki, a maksymalna wartość prawdopodobieństwa odchylenia standardowego jest pierwiastkiem kwadratowym wariancji próbki. Ponownie, są to pocieszające wyniki, które potwierdzają „zdroworozsądkową” praktykę. Rozważmy teraz model liniowo-gaussowski z jednym ciągłym rodzicem X i ciągłym dzieckiem Y. Jak wyjaśniono na stronie 440, Y ma rozkład Gaussa, którego średnia zależy liniowo od wartości X i którego odchylenie standardowe jest stałe. Aby poznać rozkład warunkowy P(Y jX), możemy zmaksymalizować wiarogodność warunkową

Tutaj parametry to Θ1, Θ2 i σ . Dane są zbiorem par (xj;yj), jak pokazano na rysunku 21.4. Używając zwykłych metod (Zadanie 21.LINR), możemy znaleźć maksymalne wartości prawdopodobieństwa parametrów. Sprawa jest tu inna. Jeśli weźmiemy pod uwagę tylko

parametrów 1 i 2, które definiują liniową zależność między x i y, staje się jasne, że maksymalizacja logarytmu wiarygodności względem tych parametrów jest tym samym, co minimalizacja licznika (y -( 1x+ 2))2 w wykładniku równania. Jest to strata L2, kwadrat błędu między rzeczywistą wartością y a przewidywaniem 1x+2. Jest to ilość minimalizowana przez standardową procedurę regresji liniowej. Teraz możemy zrozumieć dlaczego: minimalizacja sumy kwadratów błędów daje model prostoliniowy maksymalnego prawdopodobieństwa, pod warunkiem, że dane są generowane z szumem gaussowskim o stałej wariancji.

AI : Technologie, Aplikacje i Wyzwania : Wirtualna rzeczywistość

https://aie24.pl/

W tej części omówiono pojęcie rzeczywistości, a następnie stan najnowocześniejszych badań  klinicznych rzeczywistości wirtualnej. Tutaj dowiesz się, jak przejść od tradycyjnych obserwacji klinicznych do obserwacji klinicznych opartych na wirtualnej rzeczywistości. Będziemy kontynuować dyskusję na temat ograniczeń i przyszłych kierunków, podkreślając potrzebę bardziej obiektywnych i ilościowych środków opartych na VR w zakresie zaangażowania poznawczego, afektywnego i behawioralnego. Sekcja skupi się na omówieniu badań opartych na technologii VR na monitorach nagłownych. Każda interakcja, która łączy poczucie kontroli i przewidywania, tworzy iluzję rzeczywistości. Poczucie rzeczywistości jest subiektywne. Interakcja z otoczeniem, zaangażowanie sensomotoryczne, doświadczenie, język, kultura, emocje i rozwój wspólnie kształtują osobiste poczucie rzeczywistości . Rozważmy na przykład widmo elektromagnetyczne, którego my, ludzie, możemy dostrzec tylko ułamek promieni o długości od 400 do 700 nm, zwane światłem widzialnym. W przeciwieństwie do tego, pytony i żaby ryczące widzą promienie podczerwone (IR), kilka ptaków widzi promienie ultrafioletowe (UV), a motyl bławatek widzi promienie UV wraz ze światłem widzialnym. W populacji osób niewidomych klinicznie alternatywna modalność sensoryczna daje poczucie rzeczywistości odmienne od osób widzących. Na przykład osoby niedowidzące używają technik echolokacji lub sygnałów dźwiękowych wykorzystujących fale dźwiękowe lub kompresję ciśnienia powietrza do konceptualizacji właściwości przestrzennych, podczas gdy osoby widzące polegają głównie na wizualnych sygnałach wejściowych i odpowiadających im wizualnych sprzężeniach zwrotnych. Innym przykładem, który podważa definicję rzeczywistości, jest położenie układu sensorycznego i jego wpływ na interfejs z otoczeniem i dalszy rozwój mózgu. Zwierzęta z oczami z boku głowy, takie jak króliki czy gołębie, są najbardziej świadome swojego obszaru 360°, ale brakuje im świadomości odległości. W przeciwieństwie do tego, zwierzęta z oczami z przodu mają dostęp do odległych informacji, ale wymagają obrotu głowy, aby uzyskać tylne sygnały wizualne o 180°, aby uzupełnić pełną informację o 360°. Zwierzęta ze świadomością daleka są z natury bardziej drapieżne, podczas gdy zwierzęta ze świadomością lokalnego obszaru są zwykle ofiarami i rozwijają inne zmysły i umiejętności, aby ratować swoje życie. Wykorzystywanie określonych doświadczeń sensomotorycznych kształtuje zdolność jednostki do interakcji z otoczeniem i odpowiedniego przewidywania przebiegu działania innych obiektów w środowisku. Mały podzbiór świata, który zwierzę może wykryć, to jego „umwelt”  i to jest jego ostateczna rzeczywistość. Z powyższej podstawowej perspektywy rzeczywistości, VR obejmuje generowane komputerowo sztuczne środowisko i pozwala na zaawansowaną formę interakcji człowiek-maszyna. Ta interakcja wykracza poza tradycyjne interfejsy oparte na naciśnięciach klawiszy i pozwala użytkownikom doświadczyć wielozmysłowego, wciągającego i dynamicznego środowiska wirtualnego . Immersja jest jednym z kluczowych czynników tworzenia iluzji umweltów jako obecnych w sztucznym środowisku. Immersja to koncepcja techniczna, która skupia się przede wszystkim na tworzeniu wirtualnego środowiska, które jest inkluzywne, rozległe, żywe, angażuje otoczenie w jego projekcję oraz zapewnia interaktywny i dopasowany interfejs . Inkluzywność odnosi się do stopnia, w jakim zewnętrzna rzeczywistość fizyczna jest odcięta od środowiska wirtualnego . Ekstensywność odnosi się do zakresu modalności sensorycznych, które można przedstawić użytkownikowi. Żywość odnosi się do bogactwa bodźców, które są wyświetlane na receptory sensoryczne widza, takich jak kolor, rozdzielczość i liczba klatek na sekundę. Otoczenie odnosi się do stopnia, w jakim środowisko wirtualne jest panoramiczne i obejmuje śledzenie 360° . Otoczenie stawia sztuczną rzeczywistość na równi z fizyczną rzeczywistością na wyświetlaczu. Chociaż te aspekty są niezbędne do udawania rzeczywistości, poczucie obecności wymaga czegoś więcej niż tylko tych realistycznych pokazów. Wymaga poczucia interakcji, którą można kontrolować, przewidywać i odwzajemniać. Dopasowanie i interaktywność umożliwiają odwzorowanie realizmu sterowania w środowisku wirtualnym . Dopasowanie zapewnia fizyczną wzajemność poprzez ustalenie zależności między ruchem ciała a zmianą wyświetlania, np. obrócenie głowy w prawo o 90 ° powinno zmienić pole widzenia dopasowane do orientacji widza lub przepływu wizualnego lub wyświetlania słuchowego po efekcie Dopplera. Interaktywność umożliwia sterowanie/działanie i przewidywanie oraz umożliwia użytkownikom zmianę wirtualnego świata i wpływanie na przyszły przebieg wydarzeń. Ponadto VR wymaga fabuły, aby stworzyć atmosferę społecznościową z otoczeniem i dopasowanej interakcji z wirtualnym interfejsem. Stopień zanurzenia zależy od stopnia, w jakim system VR osiąga kontyngencje sensomotoryczne. Przygodność sensomotoryczna to sprzężenie między percepcją a działaniem , które kieruje się prawami kontroli i reguluje reakcje zgodnie z lokalnymi warunkami środowiskowymi (Warren, 2006). Należy zauważyć, że immersja ma kluczowe znaczenie dla poczucia „bycia tam lub w obecności” lub „poczucia obecności” znanego jako iluzja miejsca (PI)  i ma kluczowe znaczenie dla poczucia, że ​​przedstawiony scenariusz jest rzeczywiście dzieje się w środowisku wirtualnym, znane jako wiarygodność iluzji (PSI) . Chociaż immersja i obecność są często używane zamiennie, są to różne pojęcia. Jak opisano powyżej, immersja to obiektywny opis techniczny każdego systemu VR. Immersja umożliwia bogaty multimodalny widok panoramiczny 360° oraz multimodalną interakcję w korespondencji z ruchem ciała/głowy użytkownika w danym środowisku wirtualnym. Dla porównania, obecność lub poczucie obecności lub iluzja miejsca jest subiektywnym doświadczeniem interakcji ze środowiskiem wirtualnym . Wysoka immersja pozwala na uchwycenie wysokiego poziomu wierności wyświetlania (stopień dokładności, z jaką bodźce wirtualne przypominają projekcję bodźców rzeczywistych na nasz układ sensoryczny) oraz wysoki poziom wierności interakcji (stopień dokładności, z jaką sterowane są wirtualne obiekty przypominające rzeczywiste obiekty). Ponadto wysoka immersja jest uwarunkowana sposobem, w jaki uniemożliwia interakcję z zewnętrzną rzeczywistością fizyczną. Chociaż zaawansowanie technologiczne pomaga osiągnąć wysoki poziom immersji, nie zapewnia użytkownikowi doświadczenia z iluzją miejsca . Badania wykazały, że poziom obecności może nie odpowiadać poziomowi immersji. Użytkownik może doświadczyć podobnego poziomu obecności pomimo interakcji z innym poziomem immersyjnego środowiska , a użytkownik może zgłosić inny poziom obecności pomimo interakcji z podobnym poziomem immersyjnego środowiska . Badania wykazały, że zadanie i/lub stan emocjonalny użytkownika mogą również wpływać na doświadczanie iluzji miejsca . Sugeruje to, że wierność psychologiczna (odnosi się do stopnia, w jakim wirtualne bodźce wywołują reakcję fizjologiczną lub emocjonalną podobną do tej, jakiej można doświadczyć w prawdziwym życiu) wraz z wiernością techniczną tworzą razem iluzję miejsca . Jeśli chodzi o koncepcję immersji i iluzji miejsca, ważne staje się uznanie różnicy między różnymi typami systemów VR pod względem ich stopnia zanurzenia. Rozróżnienie pomiędzy systemami VR nie jest powszechnie akceptowane ze względu na niejednorodne kryteria włączenia/wyłączenia przy definiowaniu systemu VR. Istnieją trzy główne kategorie systemów VR, które są obecnie dostępne na rynku. Różni się od nie immersyjnych systemów VR, takich jak komputer stacjonarny, po bardzo wciągające systemy, takie jak montowany na głowie wyświetlacz VR (HMD). Nieimmersyjny system VR charakteryzuje się niską wiernością wyświetlania i interakcji. Inkluzywność, żywość i przestrzenność to kluczowe elementy wyświetlania, które tworzą różnicę między systemami VR o wysokiej i niskiej wierności wyświetlania. Wysoka w porównaniu do systemu VR o niskiej wierności wyświetlania pozwala użytkownikowi doświadczyć bogatej, trójwymiarowej, multimodalnej atmosfery 360°. Inkluzywność w systemach VR o wysokiej wierności wyświetlania, takich jak HMD oculus Rift, ogranicza użytkowników do interakcji ze światem zewnętrznym, podczas gdy system VR o niskiej wierności wyświetlania, taki jak VR na pulpicie 2D, nie ogranicza odwrócenia uwagi użytkownika od zewnętrznej rzeczywistości fizycznej . Wizualny wyświetlacz 2D na pulpicie jest ograniczony do 20–40° i brakuje w nim dokładnego odwzorowania rzeczywistego otoczenia 360°. Przełamuje wrażenia otoczenia podczas oglądania dynamicznego wirtualnego środowiska 2D. Podobnie wysoka w porównaniu z niską wiernością sterowania pozwala użytkownikom kontrolować i przewidywać działanie, tak jak w rzeczywistych ustawieniach. Wierność sterowania osiąga się poprzez dopasowanie (odnosi się do wzajemnej relacji między ruchem ciała a zmianą otoczenia) i interakcję (odnosi się do umiejętności manipulowania wirtualnymi obiektami i przewidywania ich przyszłego działania zgodnie z manipulacją). Jednak wyzwaniem jest odwzorowanie wierności sterowania na rzeczywistych ustawieniach w nieimmersyjnym systemie VR, takim jak pulpit .

Modele generatywne i dyskryminacyjne

https://aie24.pl/

Możemy wyróżnić dwa rodzaje modeli uczenia maszynowego stosowanych w klasyfikatorach: generatywne i dyskryminacyjne. Model generatywny modeluje rozkład prawdopodobieństwa każdej klasy. Na przykład naiwny klasyfikator tekstu Bayesa  tworzy osobny model dla każdej możliwej kategorii tekstu — jeden dla sportu, jeden dla pogody i tak dalej. Każdy model zawiera prawdopodobieństwo a priori kategorii — na przykład P(Category=pogoda) — oraz prawdopodobieństwo warunkowe P(Inputs jCategory=pogoda). Z tego możemy obliczyć wspólne prawdopodobieństwo P(Inputs;Category=pogoda)) i możemy wygenerować losowy wybór słów, które są reprezentatywne dla tekstów w kategorii pogody. Model dyskryminacyjny bezpośrednio uczy się granicy decyzyjnej między klasami. Oznacza to, że model dyskryminacyjny uczy się P(Categoryj Inputs). Biorąc pod uwagę przykładowe dane wejściowe, model dyskryminacyjny wygeneruje kategorię wyjściową, ale nie można użyć modelu dyskryminacyjnego do, powiedzmy, wygenerowania losowych słów, które są reprezentatywne dla kategorii. Regresja logistyczna, drzewa decyzyjne i maszyny wektorów pomocniczych to modele dyskryminacyjne. Ponieważ modele dyskryminacyjne kładą cały swój nacisk na zdefiniowanie granicy decyzyjnej – to znaczy faktycznie wykonują zadanie klasyfikacyjne, o które zostały poproszone – mają tendencję do lepszej pracy w granicach, przy dowolnej ilości danych uczących. Jednak przy ograniczonych danych w niektórych przypadkach model generatywny działa lepiej. (Ng i Jordan, 2002) porównują generatywny naiwny klasyfikator Bayesa z dyskryminacyjnym klasyfikatorem regresji logistycznej na 15 (małych) zestawach danych i stwierdzają, że przy maksymalnej ilości danych model dyskryminacyjny radzi sobie lepiej w 9 z 15 zestawów danych, ale przy niewielkiej ilości danych model generatywny radzi sobie lepiej na 14 z 15 zestawów danych.