100 Pytań o A.I. : Jakie są różne narzędzia i platformy dla chatbotów?

Być może zastanawiasz się, które są głównymi firmami chatbot i które narzędzia mogą pomóc Ci zacząć. Obecnie dostępnych jest wiele różnych narzędzi, a każdego dnia powstaje ich więcej ponieważ chatboty stają się coraz ważniejsze dla firm.

•  Platformy do przesyłania wiadomości błyskawicznych: są to platformy, na których klienci lub klienci będą korzystać z chatbota. Na przykład dla większości firm B2C (business-to-Consumer) Facebook Messenger byłby głównym wyborem, podczas gdy wiele firm B2B (business-to-business) mogłoby zbudować swoje chatboty dla Slack, narzędzia do komunikacji błyskawicznej często używanego przez firmy B2B .

•  Narzędzia do budowania Chatbota: Są to różne narzędzia, które mogą pomóc w zbudowaniu własnego chatbota. Prawdopodobnie najbardziej znanymi opcjami dla małych i średnich firm są Chatfuel i Manychat. Osobiście polecam Chatfuel, z którego korzysta także wiele dużych i znanych firm.

•  Narzędzia AI: Są to narzędzia do budowania chatbota, które pozwalają na funkcje oparte na AI, takie jak przetwarzanie języka naturalnego (NLP), a nawet chatboty z obsługą głosu. Watson, Amazon Lex, Microsoft Azure i Google Dialogflow firmy IBM to najbardziej uznani dostawcy w tej kategorii.

•  Smart Personal Assistants: są to asystenci osobisti, tacy jak Google Assistant, Alexa Alexa, Cortana Microsoftu i Siri Apple. Spośród nich Alexa Amazona jest tą, w której większość firm zbudowała chatboty z obsługą głosu, chociaż zrobiły to głównie duże firmy. Możliwe jest jednak, że w przyszłości większość małych firm będzie mogła również zintegrować swoje chatboty z tymi inteligentnymi osobistymi asystentami.

Dynamiczne sieci bayesowskie

Dynamiczne sieci bayesowskie (DBNs) rozszerzają semantykę standardowych sieci bayesowskich, aby obsłużyć modele prawdopodobieństwa czasowego . Widzieliśmy już przykłady DBN: sieć parasolową i sieć filtrów Kalmana. Ogólnie rzecz biorąc, każdy wycinek DBN może mieć dowolną liczbę zmiennych stanu Xt i zmiennych dowodowych Σt . Dla uproszczenia zakładamy, że zmienne, ich połączenia i ich rozkłady warunkowe są dokładnie replikowane w każdym wycinku oraz że DBN reprezentuje proces Markowa pierwszego rzędu, tak że każda zmienna może mieć rodziców tylko we własnym wycinku lub w poprzedzający kawałek. W ten sposób DBN odpowiada sieci bayesowskiej z nieskończenie wieloma zmiennymi. Powinno być jasne, że każdy ukryty model Markowa może być reprezentowany jako DBN z pojedynczej zmiennej stanu i pojedyncza zmienna dowodowa. Jest również tak, że każdy dyskretny DBN może być reprezentowany jako HMM; jak wyjaśniono w rozdziale 14.3, możemy połączyć wszystkie zmienne stanu w DBN w jedną zmienną stanu, której wartości są wszystkimi możliwymi krotkami wartości poszczególnych zmiennych stanu. Teraz, jeśli każdy HMM jest DBN i każdy DBN można przetłumaczyć na HMM, jaka jest różnica? Różnica polega na tym, że rozkładając stan złożonego systemu na jego zmienne składowe, możemy wykorzystać rzadkość w modelu prawdopodobieństwa czasowego. Aby zobaczyć, co to oznacza w praktyce, pamiętaj, że w sekcji 14.3 powiedzieliśmy, że reprezentacja HMM dla procesu czasowego z n zmiennymi dyskretnymi, każda z wartościami do d, wymaga macierzy przejścia o rozmiarze O(d2n). Z drugiej strony reprezentacja DBN ma rozmiar O(ndk), jeśli liczba rodziców każdej zmiennej jest ograniczona przez k. Innymi słowy, reprezentacja DBN jest liniowa, a nie wykładnicza pod względem liczby zmiennych. W przypadku robota próżniowego z 42 potencjalnie brudnymi lokalizacjami liczba wymaganych prawdopodobieństw zmniejsza się z 5 x 1029 do kilku tysięcy. Wyjaśniliśmy już, że każdy model filtra Kalmana może być reprezentowany w DBN za pomocą zmiennych ciągłych i rozkładów warunkowych liniowo-gaussowskich (rysunek 14.9). Z dyskusji na końcu poprzedniej sekcji powinno jasno wynikać, że nie każdy DBN może być reprezentowany przez model filtra Kalmana. W filtrze Kalmana bieżący rozkład stanu jest zawsze pojedynczym wielowymiarowym rozkładem Gaussa — to znaczy pojedynczym „wybrzuszeniem” w określonej lokalizacji. Z drugiej strony DBN mogą modelować dowolne rozkłady. W wielu rzeczywistych zastosowaniach ta elastyczność jest niezbędna. Rozważmy na przykład aktualną lokalizację moich kluczy. Mogą być w mojej kieszeni, na stoliku nocnym, na kuchennym blacie, zwisają z drzwi wejściowych lub zamknięte w samochodzie. Pojedynczy guz Gaussa, obejmujący wszystkie te miejsca, musiałby oznaczać znaczne prawdopodobieństwo, że klucze znajdują się w powietrzu nad frontowym ogrodem. Aspekty świata rzeczywistego, takie jak czynniki celowe, przeszkody i kieszenie, wprowadzają „nieliniowości”, które wymagają kombinacji zmiennych dyskretnych i ciągłych w celu uzyskania rozsądnych modeli.

100 Pytań o A.I. : Czym są Chatboty i dlaczego mają one znaczenie?

W istocie chatboty to programy komputerowe, które prowadzą rozmowy za pomocą tekstu lub dźwięku. Te stają się coraz bardziej powszechne, dlatego ważne jest, aby zrozumieć, jak działają i jak można z nich skorzystać. Eduardo Manchón, hiszpański przedsiębiorca technologiczny i założyciel Panoramio (usługa sprzedana Google w 2007 r.), uważa, że konsumenci będą się przede wszystkim komunikować z firmami za pośrednictwem chatbotów, ponieważ jest to bardziej naturalny proces rozpoczynania rozmowy niż wypełnianie formularzy na stronie internetowej. Z tego powodu przewiduje, że chatboty będą bardziej popularne niż strony internetowe lub aplikacje mobilne. Osobiście przewiduję, że tak się kiedyś stanie, zwłaszcza gdy technologie rozwijają się do tego stopnia, że chatboty mogą działać z wykorzystaniem głosu. Podobnie, Stan Chudnovsky, wiceprezes Facebook Messenger, uważa, że w przyszłości ludzie będą częściej próbować komunikować się z firmami za pośrednictwem platform komunikacyjnych, preferując szybką i łatwą konwersację niż długie oczekiwanie przez telefon. Według Chudnovsky′ego ponad 100 000 programistów buduje obecnie chatboty dla platformy Facebook Messenger. Daje to pewną wiarygodność teorii, że najlepsza forma reklamy w przyszłości będzie pochodzić z połączenia usług ludzkich i chatbotów. W tym scenariuszu ludzie mogą przejąć rozmowę, gdy chatbot nie może odpowiedzieć na pytania lub rozwiązać problemów. Obecnie tego rodzaju mieszane modele chatbotów wydają się oferować najlepsze wyniki. Istnieją dwa podstawowe rodzaje technologii chatbot. Pierwszy działa według prostych, z góry określonych zasad, a drugi działa ze sztuczną inteligencją. Jedną z głównych zalet korzystania z chatbotów jest to, że mogą zwiększyć szybkość komunikacji, oferując odpowiedzi 24/7. Istnieje wiele sposobów korzystania z chatbotów, takich jak zamawianie pizzy, przeglądanie uzgodnień dotyczących podróży, proszenie o informacje o produktach lub otrzymywanie porad dotyczących urody. W miarę rozwoju i ewolucji technologii chatboty będą wdrażane w nowy i innowacyjny sposób. Oto kilka zaskakujących statystyk dotyczących rozwoju narzędzi chatbot:

•  47 procent konsumentów twierdzi, że byliby otwarci na kupowanie przedmiotów przez chatbota. 37 procent kupiłoby przedmioty z Facebooka. 67 procent konsumentów skontaktowało się z chatbotem w celu obsługi klienta w ciągu ostatniego roku.

•  W chatbocie Adidas ponad 2000 osób zgłosiło się do udziału w ciągu pierwszych dwóch tygodni po uruchomieniu, z częstym użyciem w 80 procentach. Po pierwszym tygodniu wskaźnik retencji wynosił 60 procent, co według marki jest znacznie lepsze niż można to osiągnąć za pomocą aplikacji.

•  80 procent firm twierdzi, że chce oferować chatboty do roku 2020.

Jednym z głównych czynników torujących drogę wzrostowi wykorzystania chatbota jest ekosystem aplikacji mobilnych, który staje się coraz bardziej zatłoczony, co utrudnia ludziom usłyszenie swoich głosów. Chociaż rynek aplikacji mobilnych może być przesycony, większość właścicieli smartfonów korzysta z kilku aplikacji mobilnych na co dzień. To stwarza idealne środowisko dla chatbotów, które naprawdę mogą złapać. Chatboty są wciąż stosunkowo nowe i mają ten czynnik nowości, co czyni je intrygującą opcją dla osób, które chcą spróbować czegoś innego. Z czasem chatboty staną się lepsze w dopasowywaniu ludzkich rozmów, umożliwiając większą część interakcji z klientami i komunikację wewnętrzną firmy za pośrednictwem chatbotów.

Możliwość zastosowania filtrowania Kalmana

Filtr Kalmana i jego opracowania są wykorzystywane w szerokiej gamie zastosowań. „Klasyczne” zastosowanie to radarowe śledzenie samolotów i pocisków. Powiązane zastosowania obejmują śledzenie akustyczne okrętów podwodnych i pojazdów naziemnych oraz wizualne śledzenie pojazdów i ludzi. W nieco bardziej ezoterycznej żyle filtry Kalmana służą do rekonstrukcji trajektorii cząstek na podstawie zdjęć z komór bąbelkowych i prądów oceanicznych z pomiarów powierzchni satelitów. Zakres zastosowań jest znacznie większy niż tylko śledzenie ruchu: wystarczy każdy system charakteryzujący się ciągłymi zmiennymi stanu i zaszumionymi pomiarami. Takie systemy obejmują celulozownie, zakłady chemiczne, reaktory jądrowe, ekosystemy roślinne i gospodarki narodowe. Fakt, że filtrowanie Kalmana można zastosować do systemu, nie oznacza, że ​​wyniki będą prawidłowe lub użyteczne. Poczynione założenia — modele liniowego przejścia Gaussa i modele czujników — są bardzo mocne. Rozszerzony filtr Kalmana (EKF) próbuje przezwyciężyć nieliniowości w modelowanym systemie. System jest nieliniowy, jeśli modelu przejścia nie można opisać jako mnożenia macierzy wektora stanu, jak w równaniu .EKF działa poprzez modelowanie systemu jako lokalnie liniowego w xt w obszarze xt ​​= μt , czyli średniej bieżącego rozkładu stanu. Działa to dobrze w przypadku płynnych, dobrze zachowujących się systemów i pozwala trackerowi utrzymywać i aktualizować rozkład stanu Gaussa, który jest rozsądnym przybliżeniem do prawdziwego a posteriori. Co to znaczy, że system jest „niegładki” lub „źle zachowywany”? Z technicznego punktu widzenia oznacza to, że istnieje znacząca nieliniowość w odpowiedzi systemu w obszarze, który jest „bliski” (zgodnie z kowariancją Σt ) do aktualnej średniej μt . Aby zrozumieć tę ideę w kategoriach nietechnicznych, rozważ przykład próby wyśledzenia ptaka przelatującego przez dżunglę. Wydaje się, że ptak zmierza z dużą prędkością prosto w pień drzewa. Filtr Kalmana, regularny lub rozszerzony, może jedynie przewidywać położenie ptaka, a średnia tego Gaussa będzie wyśrodkowana na pniu, jak pokazano na rysunku (a). Z drugiej strony, rozsądny model ptaka przewidziałby uniknięcie z jednej lub drugiej strony, jak pokazano na rysunku (b). Taki model jest wysoce nieliniowy, ponieważ decyzja ptaka jest bardzo zróżnicowana w zależności od jego dokładnego położenia względem pnia.

Do obsługi takich przykładów wyraźnie potrzebujemy bardziej wyrazistego języka do reprezentowania zachowania modelowanego systemu. W społeczności teorii sterowania, w przypadku której problemy, takie jak manewrowanie z wymijaniem przez samoloty, wiążą się z podobnymi trudnościami, standardowym rozwiązaniem jest przełączający filtr Kalmana. W tym podejściu wiele filtrów Kalmana działa równolegle, z których każdy wykorzystuje inny model systemu — na przykład jeden do lotu prostego, jeden do ostrych skrętów w lewo i jeden do ostrych skrętów w prawo. Używana jest ważona suma prognoz, w której waga zależy od tego, jak dobrze każdy filtr pasuje do bieżących danych. W następnej sekcji zobaczymy, że jest to po prostu szczególny przypadek ogólnego dynamicznego modelu sieci bayesowskiej, uzyskany przez dodanie dyskretnej zmiennej stanu „manewru” do sieci.

100 Pytań o A.I. : Czy sztuczna inteligencja może być Twoim nowym zespołem prawnym?

Kiedy po raz pierwszy przetestowałem chatbota AI na donotpay.co.uk, teraz dostępnym na https://donotpay-search-master.herokuapp.com, byłem zdumiony szybkością, z jaką mógł się ze mną komunikować. Ten niezwykły chatbot, który zapewnia bezpłatną i szybką pomoc prawną, może pomóc w wielu drobnych kwestiach prawnych, takich jak kwestionowanie biletu parkingowego. W rzeczywistości, zgodnie z artykułem w The Guardian, ten legalny asystent chatbota był w stanie z powodzeniem pokonać ponad 160 000 biletów parkingowych w dużych miastach, takich jak Londyn i Nowy Jork, bez żadnych kosztów dla użytkowników. W prasie ten chatbot otrzymał tytuł pierwszego na świecie prawnika chatbota, co prowadzi wielu do przewidywania, że w przyszłości takie narzędzia zakończą potrzebę tradycyjnych prawników. Jednocześnie należy pamiętać, że obecnie usługa ta jest dość ograniczona i nie może wykonywać wielu zadań pełnomocnika, takich jak reprezentowanie cię w sądzie lub odwiedzanie cię w miejscu prowadzenia działalności. . Oczywiste jest jednak to, że wiele mniej złożonych zadań prawnych Oczywiste jest jednak to, że wiele mniej złożonych zadań prawnych wykonywanych obecnie przez profesjonalnych prawników wkrótce zostanie przeniesionych do chatbotów napędzanych sztuczną inteligencją. Oprócz walki z biletami drogowymi, chatboty AI mogą być również wykorzystywane do badania patentów i pobierania informacji z legalnych baz danych, co czyni je kuszącym narzędziem dla małych i średnich firm. Podczas gdy prawnicy nadal będą zajmować się większymi lub bardziej złożonymi zadaniami, wielu z tych prawników prawdopodobnie zacznie korzystać z chatbotów opartych na sztucznej inteligencji, aby pomóc im w codziennych obowiązkach.

Ogólny przypadek

Powyższe wyprowadzenie ilustruje kluczową właściwość rozkładów Gaussa, która umożliwia działanie filtrowania Kalmana: fakt, że wykładnik jest formą kwadratową. Dotyczy to nie tylko przypadku jednowymiarowego; pełny wielowymiarowy rozkład Gaussa ma postać

Mnożąc wyrazy w wykładniku, widzimy, że wykładnik jest również funkcją kwadratową wartości xi w x. W ten sposób filtrowanie zachowuje gaussowski charakter rozkładu stanu. Najpierw zdefiniujmy ogólny model czasowy używany z filtrowaniem Kalmana. Zarówno model przejściowy, jak i model czujnika muszą być transformacją liniową z dodatkiem szumu Gaussa. Tak więc mamy

gdzie F i Σx są macierzami opisującymi model przejścia liniowego i kowariancją szumu przejścia, a H i Σz są odpowiednimi macierzami dla modelu czujnika. Teraz zaktualizowane równania dla średniej i kowariancji, w ich pełnej, włochatej okropności, to

gdzie

jest macierzą wzmocnienia Kalmana. Niezależnie od tego, czy wierzysz czy nie , równania te mają jakiś intuicyjny sens. Rozważmy na przykład aktualizację oszacowania średniego stanu μ. Termin Fμt jest przewidywanym stanem w t +1, więc HFμt jest przewidywaną obserwacją. Dlatego termin zt+1 – HFμt reprezentuje błąd w przewidywanej obserwacji. Jest to mnożone przez Kt+1 w celu skorygowania przewidywanego stanu; stąd Kt+1 jest miarą tego, jak poważnie należy traktować nową obserwację w stosunku do przewidywania. Podobnie jak w równaniu , mamy również własność, że aktualizacja wariancji jest niezależna od obserwacji. Sekwencję wartości Σt i Kt można zatem obliczyć w trybie offline, a rzeczywiste obliczenia wymagane podczas śledzenia w trybie online są dość skromne. Aby zilustrować działanie tych równań, zastosowaliśmy je do problemu śledzenia obiektu poruszającego się na płaszczyźnie X–Y. Zmienne stanu to więc F, Σx, H i Σz to macierze  4 x 4. Rysunek (a) pokazuje prawdziwą trajektorię, serię zaszumionych obserwacji i trajektorię oszacowaną przez filtrowanie Kalmana, wraz z kowariancjami wskazanymi przez kontury z jednym odchyleniem standardowym. Proces filtrowania dobrze sprawdza się w śledzeniu rzeczywistego ruchu i zgodnie z oczekiwaniami wariancja szybko osiąga ustalony punkt. Możemy również wyprowadzić równania do wygładzania i filtrowania za pomocą modeli liniowo-gaussowskich. Wyniki wygładzania pokazano na rysunku (b). Zwróć uwagę, jak wariancja oszacowania pozycji jest znacznie zmniejszona, z wyjątkiem końców trajektorii (dlaczego?) i że oszacowana trajektoria jest znacznie gładsza.

100 Pytań o A.I. : W jaki sposób sztuczna inteligencja zmienia zasoby ludzkie i zatrudnia?

Czy chcesz szybko potwierdzić swoje świadczenia lub sprawdzić, ile dni urlopu pozostało do wykorzystania w tym roku? Po prostu poproś chatbota Twojej firmy, aby natychmiast uzyskał odpowiedzi. Wyobraź sobie, że nie musisz sprawdzać podręcznika pracownika firmy ani dzwonić do przedstawiciela działu zasobów ludzkich (HR), zamiast tego możesz polegać na wysoce inteligentnym zasobie sztucznej inteligencji, aby szybko i łatwo uzyskać odpowiedzi na podstawowe pytania dotyczące zasobów ludzkich. Technologie AI idealnie pasują do wielu codziennych czynności pracowników zasobów ludzkich. W miarę, jak więcej procesów HR wykonywanych jest za pomocą narzędzi AI, koszty pracy dla firm będą spadać wraz ze wzrostem wydajności. Jedną z wiodących firm na czele tego rodzaju technologii jest Talla, Inc. Ta firma rozwija chatboty, które koncentrują się na poprawie wewnętrznej komunikacji w firmie, jednocześnie umożliwiając menedżerom szybkie i łatwe tworzenie zapowiedzi spotkań oraz wysyłanie zaplanowanych wiadomości do swoich zespołów. . Te funkcje, wraz z kilkoma innymi, ułatwiają poprawę wydajności firmy. W miarę udoskonalania narzędzi do zarządzania zasobami ludzkimi opartych na sztucznej inteligencji prawdopodobnie większa liczba dużych i małych firm będzie korzystać z chatbotów i podobnych narzędzi w celu usprawnienia wewnętrznej komunikacji. Narzędzia oparte na sztucznej inteligencji można również zastosować w procesie rekrutacji. Tradycyjnie firmy musiały spędzać niezliczone godziny, aby znaleźć odpowiedniego kandydata na stanowisko, przeszukując bazy danych lub przeglądając CV w celu porównania kandydatów. Teraz asystenci AI mogą szybko zbierać szczegółowe informacje o kandydatach z mediów społecznościowych i profesjonalnych witryn, takich jak LinkedIn, analizować ich wyniki i przekazywać menedżerom rekomendacje dotyczące zatrudniania. Wartość tych narzędzi wykracza jednak daleko poza proces zatrudniania, ponieważ firmy mogą również wykorzystywać zasoby oparte na sztucznej inteligencji do analizowania wydajności pracy swoich pracowników, badając takie informacje, jak to, jak często osoba jest opóźniona lub wartość pieniężna utraconych kontraktów przez konkretnego pracownika. Menedżerowie mogą przeglądać te dane i wykorzystywać je do podejmowania decyzji dotyczących personelu. W przyszłości pracownicy mogą nawet zostać zwolnieni wyłącznie na podstawie analitycznych zaleceń tego typu oprogramowania AI. Futurysta Gerd Leonhart, autor książki Technology vs. Humanity, którą bardzo polecam przeczytać, stworzył termin “androrithms”, aby zasugerować, że istnieją szczególne ważne cechy ludzkie, w tym empatia, kreatywność i opowiadanie historii, których nie można bezpośrednio zmierzyć za pomocą maszyn . Sugeruje, że z tego powodu nawet najlepszych narzędzi sztucznej inteligencji nigdy nie należy używać samodzielnie do podejmowania decyzji HR, a raczej należy je stosować wraz ze starannym rozważeniem i wkładem ze strony menedżerów

Prosty jednowymiarowy przykład

Powiedzieliśmy, że operator FORWARD dla filtru Kalmana odwzorowuje gaussowskie na nowe gaussowskie. Przekłada się to na obliczenie nowej średniej i kowariancji z poprzedniej średniej i kowariancji. Wyprowadzenie reguły aktualizacji w ogólnym (wielowymiarowym) przypadku wymaga dość dużo algebry liniowej, więc na razie będziemy trzymać się bardzo prostego przypadku jednowymiarowego, a później podamy wyniki dla przypadku ogólnego. Nawet dla przypadku jednowymiarowego obliczenia są nieco żmudne, ale uważamy, że warto je zobaczyć, ponieważ użyteczność filtra Kalmana jest tak ściśle powiązana z matematycznymi właściwościami rozkładów Gaussa. Rozważany przez nas model czasowy opisuje błądzenie losowe pojedynczej ciągłej zmiennej stanu Xt z zaszumioną obserwacją Zt . Przykładem może być wskaźnik „zaufania konsumentów”, który można modelować jako przechodzący co miesiąc losową zmianę w rozkładzie gaussowskim i który jest mierzony za pomocą losowej ankiety konsumenckiej, która wprowadza również szum próbkowania gaussowski. Zakłada się, że poprzedni rozkład jest gaussowski z wariancją σ20:

(Dla uproszczenia używamy tego samego symbolu α dla wszystkich stałych normalizujących w tej sekcji). Model przejściowy dodaje zaburzenie Gaussa o stałej wariancji σ2x do bieżącego stanu:

Model czujnika zakłada szum Gaussa z wariancją σ2z :

Teraz, biorąc pod uwagę poprzednie P(X0), jednostopniowy rozkład przewidziany pochodzi z równania

Ta całka wygląda na dość skomplikowaną. Kluczem do postępu jest zauważenie, że wykładnik jest sumą dwóch wyrażeń, które są kwadratowe w x0, a zatem sam jest kwadratem w x0. Prosta sztuczka znana jako uzupełnianie kwadratu pozwala na przepisanie dowolnego kwadratu ax20 +bx0+c jako Uzupełnienie kwadratu sumy kwadratu składnika a(x0 – -b/2a)2 i składnika resztkowego c – b2/4a, który jest niezależny od x0. W tym przypadku mamy a=( σ20 + σ2x )/( σ20 σ2 ), b = -2(σ20x1 + σ2x μ0)/( σ20 σ2x ) i c=( σ20x21 + σ2x μ20 )/( σ20 σ2x ). Człon resztkowy można wziąć poza całkę, co daje nam

Teraz całka jest po prostu całką Gaussa w całym jego zakresie, czyli po prostu 1. Tak więc pozostaje nam tylko człon rezydualny z kwadratu. Wstawiając z powrotem wyrażenia dla a, b i c i upraszczając, otrzymujemy

Oznacza to, że jednoetapowy rozkład przewidziany jest rozkładem Gaussa z taką samą średnią μ0 i wariancją równą sumie oryginalnej wariancji σ20 i wariancji przejścia σ2x . Aby zakończyć krok aktualizacji, musimy uzależnić obserwację w pierwszym kroku czasowym, czyli z1. Z równania jest to

Jeszcze raz łączymy wykładniki i uzupełniamy kwadrat, otrzymując następujące wyrażenie dla tyłu:

Tak więc po jednym cyklu aktualizacji mamy nowy rozkład Gaussa dla zmiennej stanu. Ze wzoru Gaussa w równaniu widzimy, że nową średnią i odchylenie standardowe można obliczyć na podstawie starej średniej i odchylenia standardowego w następujący sposób:

Rysunek przedstawia jeden cykl aktualizacji filtru Kalmana w przypadku jednowymiarowym dla poszczególnych wartości modeli przejścia i czujników.

Równanie pełni dokładnie taką samą rolę jak ogólne równanie filtrowania lub równanie filtrowania HMM . Jednak ze względu na szczególną naturę rozkładów Gaussa, równania te mają kilka interesujących dodatkowych właściwości. Po pierwsze, możemy zinterpretować obliczenia dla nowej średniej μt+1 jako średnią ważoną nowej obserwacji zt+1 i starej średniej μt . Jeśli obserwacja jest zawodna, to σ2z jest duże i zwracamy większą uwagę na starą średnią; jeśli stara średnia jest zawodna ( σ2t jest duża) lub proces jest wysoce nieprzewidywalny ( σ2x jest duża), to zwracamy większą uwagę na obserwację. Po drugie, zauważ, że aktualizacja wariancji σ2t+1 jest niezależna od obserwacji. Możemy zatem z góry obliczyć, jaka będzie kolejność wartości wariancji. Po trzecie, sekwencja wartości wariancji szybko zbliża się do stałej wartości, która zależy tylko od σ2x i σ2z, co znacznie upraszcza dalsze obliczenia.

100 Pytań o A.I. : Jak zaoszczędzić czas dzięki rachunkowości opartej na sztucznej inteligencji?

Spójrzmy prawdzie w oczy … dla większości przedsiębiorców i właścicieli firm księgowość to czynność, która wymaga nie tylko dużo czasu i energii, ale także umiejętności matematycznych. Jednak te same czynniki, które sprawiają, że rachunkowość jest trudna i uciążliwa dla człowieka, to te same czynniki, które sprawiają, że rachunkowość idealnie pasuje do technologii AI. Jedna firma, która obecnie dobrze wykorzystuje narzędzia księgowe oparte na sztucznej inteligencji, nazywa się Dooer. Jest to szwedzki startup AI, który wykorzystuje rozpoznawanie wizualne i sztuczną inteligencję do automatyzacji podstawowych zadań księgowych. Niedawny cytat z Business Insider ujawnia, jak działa ich proces: “Niektóre przykłady tych zadań to robienie zdjęć pokwitowań i faktury lub zestawienia dochodów i wynagrodzeń. Są one wprowadzane na platformę Dooer, która jest zintegrowana z kontem bankowym klienta i szwedzkimi organami podatkowymi. Dooer następnie dopasowuje transakcje bankowe klienta do dostarczonych paragonów i faktur i wysyła podsumowanie do zatwierdzenia do końca miesiąca. “W miarę rozwoju technologii prawdopodobnie pojawią się inne sztucznej inteligencji. W miarę rozwoju technologii prawdopodobnie nastąpi inne narzędzia AI, takie jak to, które pomogą przedsiębiorcom w szybszym i łatwiejszym rozliczaniu, jednak w większych firmach księgowi prawdopodobnie nadal będą potrzebni do wykonywania zadań o większym stopniu złożoności.

Aktualizowanie rozkładów Gaussa

Zrobiliśmy aluzję do kluczowej właściwości rodziny rozkładów liniowo-gaussowskich: pozostaje ona zamknięta podczas aktualizacji bayesowskiej. (Oznacza to, że biorąc pod uwagę jakiekolwiek dowody, a posteriori nadal znajduje się w rodzinie liniowo-gaussowskiej). Tutaj precyzujemy to twierdzenie w kontekście filtrowania w modelu prawdopodobieństwa czasowego. Wymagane właściwości odpowiadają dwuetapowemu obliczeniu filtrowania w równaniu:

  1. Jeżeli obecny rozkład P(Xt |e1:t) jest gaussowski, a model przejściowy P(Xt+1 | xt) jest liniowo-gaussowski, to jednoetapowy rozkład przewidziany wyrażony przez

jest również rozkładem Gaussa.

2. Jeżeli przewidywanie P(Xt+1 |e1:t) jest gaussowskie, a model czujnika P(et+1 | Xt+1) jest liniowo-gaussowski, to po uwarunkowaniu nowym dowodem zaktualizowany rozkład

jest również rozkładem Gaussa.

Zatem operator FORWARD dla filtrowania Kalmana przyjmuje gaussowską wiadomość przekazującą f1:t, określoną przez średnią μt i kowariancję Σt , i tworzy nową wielowymiarową przekazową wiadomość gaussowską f1:t+1, określoną przez średnią μt+1 i kowariancję Σt+1. Jeśli więc zaczniemy od gaussowskiego poprzedzającego f1:0=P(X0)= (μ00), filtrowanie za pomocą modelu liniowo-gaussowskiego daje rozkład stanu Gaussa przez cały czas. To wydaje się być ładnym, eleganckim wynikiem, ale dlaczego jest to takie ważne? Powodem jest to, że poza kilkoma szczególnymi przypadkami, takimi jak ten, filtrowanie za pomocą sieci ciągłych lub hybrydowych (dyskretnych i ciągłych) generuje rozkłady stanów, których reprezentacja rośnie bez ograniczeń w czasie.