Mail:





Słowniczek Sztucznej Inteligencji





Uważaj na lukę

O co toczy się gra

Głębokie uczenie i nie tylko

Skoro komputery są tak inteligentne, dlaczego nie potrafią czytać?

Gdzie jest Rosie?

Wglądy z ludzkiego umysłu

Zdrowy rozsądek i droga do głębokiego zrozumienia

Zaufanie

Epilog




Sztuczna Inteligencja : Gry


•  Wprowadzenie

•  Gry AI

•  Ruch

•  Znalezienie drogi

•  Podejmowanie decyzji

•  Taktyczna i strategiczna AI

•  Uczenie się

•  Proceduralne generowanie treści

•  Gry planszowe

•  Zarządzanie wykonaniem

•  Interfejs ze światem

•  Narzędzia i tworzenie treści

•  Programowanie gry AI

•  Projektowanie gry AI

•  Gatunki gier opartych na sztucznej inteligencji



A.I. dla Nie-Techników



•  Część 1 - Podstawy sztucznej inteligencji
•  Część 2 - Dane
•  Część 3 - Uczenie maszynowe
•  Część 4 - Głębokie uczenie
•  Część 5 - Robotic Process Automation
•  Część 6 - Przetwarzanie języka naturalnego (NLP)
•  Część 7 - Roboty fizyczne
•  Część 8 - Wdrażanie sztucznej inteligencji
•  Część 9 - Przyszłość sztucznej inteligencji





Sztuczna Inteligencja i Robotyka

• Co to są inteligentne roboty?

• Krótka historia robotyki

• Automatyzacja i autonomia

• Autonomia organizacji oprogramowania

• Telesystemy

• Zachowania

• Postrzeganie i zachowania

• Koordynacja behawioralna

• Lokomocja

• Czujniki i wykrywanie

• Wykrywanie zasięgu

• Warstwa deliberatywna

• Nawigacja

• Planowanie ścieżek metrycznych i planowanie ruchu

• Lokalizacja, mapowanie i eksploracja

• Uczenie się

• Funkcjonalność interaktywna

• Interakcja Człowiek-Robot

• Projektowanie i ocena systemów autonomicznych

• Etyka




Sztuczna inteligencja: podstawy i zastosowania

Część 1: Sztuczna inteligencja i nanotechnologia: superkonwergencja

Część 2: Sztuczna inteligencja w handlu elektronicznym: analiza procesów biznesowych

Część 3: ABC ery cyfrowej ze szczególnym odniesieniem do sektora bankowego

Część 4: Sztuczna inteligencja w predykcyjnej analizie ubezpieczeń i bankowości

Część 5: Sztuczna inteligencja w robotyce i automatyzacji.

Część 6: Sztuczna inteligencja: nowe podejście w opiece zdrowotnej

Część 7: Sztuczna inteligencja i spersonalizowane leki: Wspólna narracja o postępach w opiece medycznej

Część 8: Nanotechnologia i sztuczna inteligencja w medycynie precyzyjnej w onkologii

Część 9: Zastosowania sztucznej inteligencji w recepturach farmaceutycznych i leków

Część 10: Rola sztucznej inteligencji w diagnozowaniu gruźlicy

Część 11: Zastosowania sztucznej inteligencji w wykrywaniu i leczeniu COVID-19

Część 12: Sztuczna inteligencja oparta na Internecie rzeczy przy użyciu platformy Microsoft Azure

Część 13: Równoważenie obciążenia w bezprzewodowej sieci heterogenicznej za pomocą sztucznej inteligencji

Część 14: Zastosowania technik sztucznej inteligencji w systemach elektroenergetycznych

Część 15: Wpływ sztucznej inteligencji w sektorze lotniczym i kosmicznym

Część 16: Sztuczna inteligencja do prognozowania pogody

Część 17: Górnictwo molekularne: zastosowania w naukach farmaceutycznych




A.I. … i wszystko jasne




Wprowadzenie do Języka R




Język R … od słów do czynów !!!



 + Kody Źródłowe




A.I.: Jaka jest nasza Przyszłość?

[101 Prostych Pytań]




VIDEO



  Hipoteza Riemanna

 Pogadać z Maszyną 1

 Pogadać z Maszyną 2

 Pogadać z Maszyną 3

 Pogadać z Maszyną 4

 Wywiad z maszyną !

 Co słyszy Sztuczna Inteligencja?

 Komputer Kwantowy

 Świadomość Maszyn

 Sztuczna Inteligencja - Szansa czy Zagrożenie?

 This is AI 1

 This is AI 2 : How machines learn

 This is AI 3 : Learnig for life

 This is AI 4: A synthetic sixth sense




Bogowie Sztucznej Inteligencji






SŁOWNIK TERMINÓW ROBOTYCZNYCH




Anatomia Robota

  • Systemy Sterowania
  • Sprzęt Komputerowy
  • Niezawodność, Bezpieczeństwo i Zgodność
  • Kroki Projektowe: HLD
  • Energia i systemy zasilania
  • Kontrola Energii
  • DSP
  • Komunikacja
  • Silniki i Siłowniki
  • Mechanika



  • Artificial Intelligence




    Jak A.I. zmienia nasz świat




    Mity Sztucznej Inteligencji




    Króka Historia A.I.




    Fundamenty


    • Prolog

    • Wprowadzenie do A.I.

    • Definiowanie roli danych

    • Biorąc pod uwagę alogorytmy

    • Pionierski ,specjalistyczny sprzęt

    • Zastosowanie AI w aplikacjach komputerowych

    • Automatyzacja typowych procesów

    • Zastosowanie AI w medycynie

    • A.I. a poprawa interakcji

    • Analiza danych przez A.I.

    • Wykorzystanie machine learning

    • Poprawa A.I. (…)

    • Rozwój robotów

    • Latanie dronami

    • Samochód napędzany A.I.

    • Zroumieć aplikacje bez szans

    • AI w Kosmosie

    • Nowe zawody w erze A.I.

    •  X zawodów dla A.I.(?)

    • Wkład A.I. w społeczeństwo

    • Jak zawiodła A.I.




    "Ocieplamy" Fundamenty


    • Intuicyjna koncepcja sztucznej inteligencji

    • Podstawy wyszukiwania

    • Inteligentne wyszukiwanie

    • Algorytmy Ewolucyjne

    • Zaawansowane podejście ewolucyjne

    • Inteligencja Roju: Mrówki

    • Inteligencja roju: Cząstki

    • Uczenie maszynowe

    • Sztuczne sieci neuronowe

    •  Uczenie się ze wzmocnieniem za pomocą Q-Learning




    XVI Filarów Świątyni ArtInt′a


    • Korzenie i Zakres

    • Reprezentacja i wyszukiwanie

    • Struktury i strategie wyszukiwania

    • Wyszukiwanie Heurystyczne

    • Metody Stochastyczne

    • Budowanie algorytmów sterowania

    • Reprezentacja Wiedzy

    • Silna metoda rozwiązywanie problemów

    • Rozumowanie w niepewnych sytuacjach

    •  Uczenie maszynowe : oparte na symbolach

    • Uczenie maszynowe : koneksjonizm

    • Uczenie maszynowe : genetyczne i awaryjne

    • Uczenie maszynowe : probabilistyczne

    • Automatyczne wnioskowanie

    • Rozumienie języka naturalnego

    • Sztuczna Inteligencja jako pytanie empiryczne




    Sztuczna Inteligencja i Big Data

    Sekcja 1 : Big Data i systemy sztucznej inteligencji

    Sekcja 2 : Ontologia dla dużych zbiorów danych

    Sekcja 3: Uczenie się z dużych zbiorów danych

    Sekcja 4:Sieci neuronowe dla dużych zbiorów danych

    Sekcja 5: Deep Big Data Analytics

    Sekcja 6: Przetwarzanie języka naturalnego

    Sekcja 7: Systemy rozmyte

    Sekcja 8: Programowanie genetyczne

    Sekcja 9: Analiza roju

    Sekcja 10: Uczenie się przez wzmocnienie

    Sekcja 11: Cyberbezpieczeństwo

    Sekcja 12: Obliczenia poznawcze












    Wczoraj , Dziś … Jutro














    Odwiedzin: 20757
    Dzisiaj: 34
    On-line: 1
    Strona istnieje: 1128 dni
    Ładowanie: 0.661 sek


    [ 5509 ]



    Sztuczna Inteligencja z Językiem NetLogo



    LINK



    "Czy wiesz, jak było?": Historia AI

    Historia nie jest klubem, z którego można wyjść do woli. - John Major

    Ile i jaki rodzaj sztucznej inteligencji może znieść człowiek?

    Nauka, którą uprawia się dzisiaj, jest magicznym lustrem, w które musimy zajrzeć, jeśli chcemy ujrzeć przebłysk tego, co ma nadejść.       (Y. Gasset)

    Jak działa sztuczna inteligencja?: Techniki sztucznej inteligencji

    Technologia może nie oszczędza nam czasu, ale inaczej go rozdziela. - Helmar Nahr


    Jak realizowana jest sztuczna inteligencja?: AI określa nasze życie

    Często przyszłość jest tutaj, zanim będziemy na nią gotowi. - John Steinbeck

    Nadal kupujesz, czy już "wpływasz"?: Handel 4.0

    Dla człowieka do działania, jego własne ja jest kiepskim punktem wyjścia. - Francis Bacon

    Zacznijmy od razu: Influencerzy nie mają nic wspólnego ze sztuczną inteligencją. Nawet naturalna inteligencja nie przychodziłaby mi do głowy, gdy spojrzysz na blogi. I to stwierdzenie można prawdopodobnie rozciągnąć również na obserwujących. Ale sztuczna inteligencja nabiera ponownie znaczenia, gdy platformy, na których ma miejsce "wpływ", spychają influencera w góry danych, aby poddać je "analityce predykcyjnej" za pomocą algorytmów.

    Bez reklamy miks marketingowy to "Nix" (nic): sztuczna inteligencja w marketingu

    Zwłaszcza we współczesnym marketingu sztuczna inteligencja staje się coraz ważniejsza i powoduje dramatyczne zmiany w handlu detalicznym. Narzekanie Henry′ego Forda, że połowa wydatków na reklamę to zmarnowane pieniądze, ale niestety nie wiemy, która połowa nie ma już uzasadnienia w czasach Big Data i spersonalizowanych komunikatów reklamowych. W przypadku reklamy cyfrowej zależność między kampanią reklamową a sprzedażą można dość dokładnie zmierzyć. Zanim jednak dojdziesz do indywidualnego podejścia do indywidualnego klienta, należy najpierw przeprowadzić wiele badań rynkowych opartych na sztucznej inteligencji. Techniki cyfrowego rozpoznawania wzorców, które Nassehi nazywa "trzecim odkryciem społeczeństwa", nie tylko doprecyzowują segmentację rynku, ale także często ujawniają zaskakujące korelacje. Na przykład brytyjska sieć hoteli Jurys odkryła korelację między korzystaniem z mediów a zachowaniem rezerwacyjnym, ponieważ wielu klientów szukało hoteli w pobliżu stadionów piłkarskich. W związku z tym sieć skonfigurowała konkretną ofertę dla tej grupy docelowej, dzięki czemu była w stanie znacznie zwiększyć rezerwacje. Analizy Big Data dzielą rynek na klastry, a nie społeczne, ale ważne grupy statystyczne ze zbiorowymi zachowaniami rynkowymi, w celu wywnioskowania selektywnych działań marketingowych. Tutaj oczywiście duże platformy mają sporą przewagę nad innymi uczestnikami rynku, ponieważ mogą budować monopole na dane swoimi "prawami do wydobycia". Mówi się już o "kapitalizmie platformowym", w którym pośrednicy GAFA (Google, Apple, Facebook, Amazon) i BAT (Baidu, Alibaba, Tencent) nie tylko dominują na rynku, ale także kontrolują zachowania klientów. Nie jest powodem, dla którego Facebook kupił producenta oprogramowania Wit-ai lub firmy PredictionIO i MetaMind, które specjalizują się w prognozowaniu, aby móc wykorzystać je do wydobywania ogromnych skarbów danych w sposób kwalifikowany. Analizy skupień służą do skompilowania grupy docelowej i ich cech behawioralnych w celu uzyskania środków marketingowych specyficznych dla klastra. To prowadzi nas do kierowania kierowanego przez sztuczną inteligencję, gdzie zwykle rozróżnia się:

    •  Kierowanie środowiskowe i socjodemograficzne (umieszczanie reklam internetowych w odpowiednich środowiskach witryn internetowych)
    •  Kierowanie regionalne/kierowanie geograficzne (zgodnie z pochodzeniem klientów)
    •  Kierowanie na słowa kluczowe (Reklama online oparta na zapytaniach wyszukiwarek lub wyszukiwarek biznesowych)
    •  Kierowanie kontekstowe (reklama online oparta na zainicjowanych kliknięciach odpowiednich środowisk)
    •  Kierowanie techniczne (Reklama online w zależności od wyposażenia technicznego klienta)
    •  Kierowanie CRM (Umieszczenie materiałów reklamowych i informacji w odniesieniu do już istniejących danych klienta)
    •  Kierowanie behawioralne (na podstawie analizy zachowania podczas surfowania (ścieżek kliknięć) internauty)
    •  Predykcyjne targetowanie behawioralne (na podstawie informacji o zachowaniu użytkowników podczas surfowania z informacjami z innych źródeł danych, takich jak dane ankietowe lub rejestracyjne)
    •  Kierowanie semantyczne (nie według słów kluczowych, ale według wszystkich widocznych tekstów i głównych tematów, dla których umieszczane są tematyczne kampanie online)
    Boty statystyczne są już wykorzystywane do automatycznego wykrywania istotnych relacji danych. W ramach zdefiniowanych grup docelowych opinie i sentymenty na temat produktów mogą być wyprowadzane za pomocą eksploracji opinii i sentymentu. Przejdźmy teraz do działań reklamowych opartych na sztucznej inteligencji. W przypadku marketingu w wyszukiwarkach (SEM) jako podobszaru marketingu internetowego podejmowane są działania mające na celu przyciągnięcie odwiedzających witrynę internetową za pośrednictwem wyszukiwarek internetowych. Rozróżnia się reklamy w wyszukiwarkach (SEA) i optymalizacji pod kątem wyszukiwarek (SEO). SEA służy do umieszczania reklam na stronach wyników wyszukiwania. Zazwyczaj są to reklamy w formie tekstowej promujące oferty pasujące do zapytania użytkownika. SEO odnosi się do działań, które służą zwiększeniu widoczności strony internetowej i jej treści dla użytkowników wyszukiwarki internetowej. Optymalizacja odnosi się do poprawy bezpłatnych wyników w bezpłatnych rankingach wyszukiwarek (oferty naturalne) i wyklucza ruch bezpośredni oraz zakup płatnej reklamy. W przeciwieństwie do organicznych wyników wyszukiwania z SEO, w SEA reklamy są finansowane w ramach procesów aukcyjnych, a ich ranking zależy m.in. ). Najnowszy trend w tym zakresie nosi nazwę "Smart Bidding" w Google. Tutaj klient reklamy może wybierać między różnymi strategiami: jeśli nie wybiera między CPA (koszt działania), ROAS (zwrot z nakładów na reklamę) lub CPC (koszt kliknięcia), może również wybrać kategorię "Maksymalizacja konwersji" w ogólny. Oprócz produktów reklamowych marketing w wyszukiwarkach jest coraz częściej wykorzystywany do brandingu korporacyjnego i public relations. W tym kontekście należy również wspomnieć o reklamie w czasie rzeczywistym (RTA). RTA, określane również jako "Reklama zautomatyzowana", obejmuje zarówno indywidualne wyświetlanie banerów na pojedyncze wyświetlenie reklamy (? wywołania nośników reklamowych), jak i proces licytacji, czyli indywidualne stawki na wyświetlenie reklamy. RTA skupia się na indywidualnym użytkowniku. Dla każdego oferowanego wyświetlenia reklamy jest dostarczany powiązany profil użytkownika, aby reklamodawca mógł zdecydować, czy chce licytować dokładnie na tym profilu użytkownika. Inną formą "marketingu cyfrowego" (kanały offline, takie jak telewizja, SMS itp. są również wykorzystywane oprócz marketingu online) jest marketing treści. Koncentruje się na tworzeniu i dystrybucji wartościowych, odpowiednich i spójnych treści, aby przyciągnąć określone grupy docelowe i ostatecznie wygenerować zyskowne działania klientów. Influencer marketing również należy do tej kategorii, ale ma niewiele wspólnego ze sztuczną inteligencją, ponieważ bardziej chodzi o cyfrową reklamę szeptaną dla obserwujących. Inaczej jest z automatyzacją content marketingu. W tym przypadku wykorzystanie istniejącej treści w sieci jest przesiewane i automatycznie przetwarzane w nową treść skierowaną do odpowiednich grup klientów we własnym asortymentem produktów firmy. Dlatego mówimy również o "kupieniu treści". Przejdźmy od marketingu zorientowanego na grupę docelową do spersonalizowanego zarządzania relacjami z klientami (CRM). Jeśli, po raz kolejny, podczas wyszukiwania w Googlingu pojawia się komunikat: "Klienci, którzy kupili… kupili też…", to oczywiście działał tzw. silnik rekomendacji. Najpierw określił Twoje zainteresowanie produktem, który kliknąłeś, a następnie na tej podstawie zalecił Ci alternatywy lub dodatkowe produkty, dzięki czemu oszczędzisz sobie kłopotów z dalszym wyszukiwaniem. Common Wealth Bank of Australia (CBA) zdobył nagrodę "Model Bank Winner" za "Customer Engagement Engine". Program CBA skupia się na "podróżach klientów" analizowanych na dużą skalę. Każde podejście do klienta - czy to online, mobilnie, w call center, w bankomacie czy w oddziale - uruchamia połączenie w CEE (Customer Electronics Edition), co daje rekomendację "następnej najlepszej rozmowy" w ciągu 150-300 ms. Sztuczna inteligencja zajmuje się również wszystkimi punktami kontaktu na drodze klienta, a następnie wykorzystuje NLP do wysyłania spersonalizowanych wiadomości e-mail. Z Asystentem Google to nie kończy się na e-mailach. Stale towarzyszy użytkownikowi, szepcząc w czasie rzeczywistym dane o pogodzie i ruchu drogowym, a nawet informacje finansowe i sportowe, polecając wskazówki dotyczące kina i układając plany podróży. Naśladuje nawet styl pisania i ton osoby, do której się zaleca. O licznych chatbotach platformowych, takich jak Siri, Cortana itp., które są w stanie prowadzić indywidualne rozmowy z klientami, wspomnieliśmy już wcześniej. Na przykład "Clara" w firmie wysyłkowej Otto to nie tylko wielofunkcyjna szafka czy krzesło do jadalni, ale także chatbot o tej samej nazwie, który odpowiada na pytania dotyczące obsługi i zamówień. Znaleziono specjalne oprogramowanie rekomendacyjne dla przemysłu muzycznego. "Ile rekomendacji muzycznych potrzebuje dana osoba?" - pyta HORST (Holistic Recommendation and StoryTelling Technology). HORST jest demonstratorem "Holistycznej/Hybrydowej Rekomendacji i Wyjaśnienia" opracowanej przez DFKI (Deutsches Forschungszentrum für Künstliche Intelligenz). Jako użytkownik klikasz swoje "pożądane muzyczne orzechy", a następnie otrzymujesz rekomendacje poparte interesującymi faktami i historiami. Podobnie jak w przypadku content marketingu, w którym treści doradcze i rozrywkowe mają trafić do grupy docelowej, sztuczna inteligencja umożliwia tak zwaną "reklamę natywną" (reklamę w znajomym środowisku). Treść jest zaprojektowana przez boty treści w taki sposób, że trudno ją rozpoznać jako reklamę, ale wygląda jak wkład redakcyjny. Dzięki rozszerzeniu treści istniejąca treść jest uzupełniana i "dopracowywana" w celu zwiększenia wskaźników zaangażowania.Firmy takie jak Phrase w przypadku tekstów głosowych lub Yala w przypadku filmów oferują usługi w tym zakresie. Facebook zbiera grupy odbiorców, dla których umieszczane są reklamy Facebook, Instagram i Audience Network. Obecnie istnieje również międzynarodowy rynek dostawców sprzedaży "reklam cyfrowych", gdzie wydawcy i marketerzy oferują swoją przestrzeń reklamową i nośniki reklamowe na swoich stronach internetowych lub w aplikacjach w celu rezerwacji reklam. Aby zmierzyć sukces reklamowy i ocenić skuteczność poszczególnych mediów reklamowych i kanałów medialnych, AdServer rejestruje wyświetlenia reklam, tj. kliknięcia, leady, sprzedaż i zamówienia, które następnie można wykorzystać do określenia współczynników konwersji. Wyniki należy wykorzystać do poprawy zarządzania doświadczeniami klientów (CEM lub CXM). Zadowoleni klienci powinni stać się lojalnymi klientami, a lojalni klienci powinni stać się "entuzjastycznymi ambasadorami" ("marka jako przyjaciel") marki lub produktu ("zadowolony - lojalny - rzecznik"). W tym kontekście pokazano już, że oferty muszą być nie tylko dostosowane do potrzeb klienta, ale także zwięzłe w obliczu coraz bardziej kurczącego się limitu uwagi (oszczędność uwagi). Dzięki zestawowi Alexa Skill Kit (ASK) z rodziny Amazon Echo dostawcy mogą tworzyć nowe niestandardowe możliwości. ASK to zbiór interfejsów API i narzędzi, za pomocą których komunikaty reklamowe mogą być transportowane w sposób wysoce selektywny w sensie "handlu wspomaganego konwersacją" do inteligentnych głośników, inteligentnych telewizorów, samochodów itp. Współczesne firmy detaliczne decydują o wydatkach klientów i miarach zgodnie z do wartości życiowej klienta (CLV), tj. marży kontrybucyjnej, którą klient realizuje w ciągu całego swojego "życia klienta", zdyskontowanej do rozważanego momentu. CLV nie należy mylić z "potencjalną wartością klienta", która jest obliczana na podstawie całkowitych wydatków (w tym zakupów od konkurentów) klienta. To wszystko można podsumować terminem "Automatyzacja marketingu". Jest to wspierana programowo metoda automatyzacji procesów marketingowych. Profile użytkowników są wzbogacane o informacje oparte na ich zachowaniach użytkowników w celu skonfigurowania zautomatyzowanych procesów kampanii dla indywidualnej komunikacji. Większość z tych pakietów oprogramowania postępuje zgodnie z "predictive lead scoring" lub tak zwanym "lead nurturing". Proces pozyskiwania leadów rozpoczyna się od wyszukania kontaktu (zapytania). W drugim kroku dostawca "pielęgnuje" kontakt, prosząc oprogramowanie o nawiązanie osobistego kontaktu (Sales Accepted Lead/SAL). Jeśli klient teraz wykaże chęć zakupu, firma szczegółowo pokazuje potencjalnemu klientowi, jaką wartość dodaną oferują w szczególności jej produkty (Sales Qualified Lead/SQL). W czwartym kroku zakup zostaje zakończony (Closed Won). Ale nie tylko w związku z Big Data sztuczna inteligencja stała się niezbędna w marketingu. AI służy również do bezpośredniej obserwacji zachowań klientów. Włoska firma A. Imax sprzedaje manekiny z komputerowym widzeniem i oprogramowaniem do rozpoznawania twarzy. Manekiny Eysee zaobserwowały między innymi, że określona grupa klientów preferuje określone wejście. Firma detaliczna odpowiedziała, odpowiednio planując towary. Od 2014 roku londyńska firma technologiczna Iconeme oferuje manekiny, które komunikują się z klientami za pośrednictwem smartfona i dostarczają klientom informacji o produktach na temat ubrań, które przymierzają. W ten sposób rejestrują również informacje dotyczące wieku, płci i lokalizacji, jaki strój oglądano i czy dokonano zakupu, czy nie. Do klasycznych funkcji marketingowych należy również kompilacja asortymentu. Tutaj sztuczna inteligencja otwiera zupełnie nowe możliwości w zakresie innowacji produktowych. Na przykład, z pomocą algorytmicznego oprogramowania do projektowania i czteroletniego okresu rozwoju, firma Nike opracowała jednoczęściowy but do biegania dla najlepszych sportowców, w którym nawet kolce nie są wkręcane, ale zintegrowane ze skorupą buta za pomocą Proces drukowania 3D. Dla czołowego sportowca, według producenta, ten but może osiągnąć poprawę o jedną dziesiątą sekundy na trasie 100 m, tym samym przesuwając go z możliwie czwartego miejsca do złotego medalu. Mniej obciążone sztuczną inteligencją są spersonalizowane trampki Adidas, które są produkowane w partii, że tak powiem, w rozmiarze 1, gdzie klient może wybrać poszczególne elementy, takie jak język buta, logo, paski, podszewka lub czapka nad palcami według własnego gustu. Ponadto Adidas i Nike oferują "buty zrób to sam" zgodnie z coraz bardziej wymagającymi prosumentami. Tak zindywidualizowane produkty wpisują się w trend w kierunku customizacji, czyli dostosowania produktów seryjnych do konkretnych potrzeb klienta. Organiczne musli z Mymuesli GmbH, gdzie klient może mieszać według firmy 566 biliardów (!) odmian, prawdopodobnie również należy do tej kategorii. Dynamiczne menu McDonald′s można również podciągnąć do tej kategorii. Ale AI umożliwia nie tylko niestandardowe warianty produktów, ale także zupełnie nowe produkty. Na przykład Carlsberg Group warzy "inteligentne piwo" z AI. Zaawansowane technologicznie czujniki rejestrują subtelne niuanse i aromaty w piwie i tworzą "piwny odcisk palca" dla każdej indywidualnej próbki. Ta baza danych służy do badania nowatorskich drożdży piwnych w celu stworzenia nowych rodzajów piwa. Rozwój metod szybkiej i niezawodnej oceny smaków w złożonych mieszaninach, takich jak piwo lub inne napoje alkoholowe i bezalkoholowe, ma oczywiście duże znaczenie dla rozwoju produktu, kontroli jakości i bezpieczeństwa. Angielska firma IntelligentX wykorzystuje tę technologię, oceniając opinie klientów za pomocą algorytmu za pośrednictwem komunikatora Facebook Messenger i odpowiednio dostosowując swoje cztery odmiany piwa na tej podstawie. Klient staje się w ten sposób "browarnikiem". To logiczne, że inne branże wykorzystują sztuczną inteligencję w podobny sposób. Na przykład Philyra to oprogramowanie AI zawierające ogromną bazę danych 3000 surowców, których używa, aby pomóc perfumiarzom w tworzeniu nowych zapachów. Dzięki temu oprogramowaniu IBM i Symrise wprowadziły pierwsze "perfumy komputerowe" w 2019 roku, oceniając 1,7 miliona formuł chemicznych. Oczywiście zastosowania takiej technologii można się spodziewać również w przemyśle farmaceutycznym i spożywczym. Przecież wietnamski kebab jabłkowy nie spada z drzewa, ale został wygenerowany za pomocą Cognitive Cooking przez "Chef" Watsona. Według Mahmouda Naghshineha z IBM Research "Ideą gotowania kognitywnego jest to, że maszyny i ludzie współpracują ze sobą - w tym przypadku bardzo złożony system analityczny, który czerpie z rozległej zgromadzonej wiedzy na temat chemii, kultury żywności i preferencji smakowych, aby pomóc szefom kuchni przełamywać nowy teren." Te przykłady pokazują udaną masową personalizację i prosumeryzm jako dwa trendy społeczne wspierane przez sztuczną inteligencję. Prosument lub prosument - będący zarówno konsumentem, jak i producentem - konfiguruje "innowacje na miarę" według własnego gustu w interaktywnym współtworzeniu z "oryginalnym producentem", przy czym ten ostatni angażuje się zatem w marketing mimetyczny, spełniając wymagania społeczne.




    Od naturalnej głupoty do sztucznej inteligencji




    Wprowadzenie

    AI dla sprzedaży i marketingu

    Dlaczego sztuczna inteligencja w sprzedaży i marketingu


    Jednym z głównych celów marketerów jest znalezienie najlepszego sposobu na zaoferowanie odpowiedniego produktu właściwemu klientowi we właściwym czasie. Ale nawet przy stawce miliardów dolarów marketerzy cierpią z powodu różnych ograniczeń. Pierwszym był brak danych. Kiedy świat nie był tak połączony jak teraz, jedynym sposobem na uzyskanie odpowiedzi na pytania była rozmowa z ludźmi. Internet w dużej mierze rozwiązał ten problem: teraz łatwiej niż kiedykolwiek dotrzeć do szerokiego grona odbiorców, narazić ich na przesłanie i zmierzyć ich reakcję. Drugą stroną medalu jest to, że łatwo jest uzyskać dane, które są tak duże i szczegółowe, że ludzie nie są w stanie zrozumieć i wydobyć spostrzeżeń. Chcemy rozpocząć, dając ci mały wgląd w to, dlaczego sztuczna inteligencja wszystko zmienia. Każdy marketer wie, że nie wszyscy klienci są tacy sami i że najlepiej reagują, gdy angażują się w spersonalizowaną wiadomość. Powszechną strategią marketingową jest dzielenie klientów na segmenty według danych demograficznych lub podobnych aspektów. Prostym segmentem mogą być "zamożne kobiety w wieku od 25 do 30 lat, które wydają na rozrywkę ponad 1000 USD rocznie". Marketer może wymyślić niestandardową wiadomość, aby dotrzeć do tej kategorii ludzi, co różni się od tego, co zostanie zrobione dla innych segmentów. Chociaż ta technika jest tak stara jak rynek, to naprawdę było najlepsze, co mogliśmy zrobić, zanim sztuczna inteligencja pojawiła się na scenie. Problem z tym podejściem polega na tym, że bez względu na to, jak dokładna jest segmentacja (marketerzy mówią o mikrosegmentacji), zawsze dojdziesz do sytuacji, w której dwóch klientów będzie traktowanych dokładnie tak samo, nawet jeśli zasadniczo się różnią, tylko dlatego, że należą do tej samej kategorii. Istnieje ograniczenie liczby kategorii, którymi może zarządzać ludzki mózg. Pomyśl tylko, ilu Twoich znajomych ma na papierze cechy podobne do Ciebie (w tym samym wieku, sąsiedztwo, wykształcenie), ale ma zupełnie inne gusta. AI zmienia zasady gry, ponieważ może przetwarzać znacznie więcej informacji. Dzięki sztucznej inteligencji możesz osiągnąć personalizację na dużą skalę, ucząc się o ludziach na podstawie ich konkretnych działań i cech oraz kierując ich na to, kim naprawdę są, a nie na ręcznie wykonane wiadro, w które wpadają. Co dla firmy oznacza zdolność tak precyzyjnej personalizacji? Cóż, firmy specjalizujące się w sztucznej inteligencji na potrzeby marketingu mogą pokazać przykuwające wzrok wskaźniki, które byłyby marzeniem każdego marketera. Przykładem jest Amplero, amerykańska firma specjalizująca się w marketingu opartym na sztucznej inteligencji. Oto niektóre z wyników, które raportuje w swoich materiałach marketingowych:

    •  Pomogło to dużemu europejskiemu operatorowi telekomunikacyjnemu zwiększyć pierwsze 30-dniowe średnie przychody na użytkownika z 0,32% do 2,8%, co stanowi prawie 800% wzrost.
    •  Obniżyło koszt pozyskania klienta (CAC) jednego z pięciu największych północnoamerykańskich operatorów komórkowych o ponad 97%: z 40 USD na klienta do zaledwie 1 USD.
    •  Udało się ponownie dotrzeć do najbardziej niezadowolonych klientów dużego europejskiego operatora komórkowego na trzy tygodnie przed anulowaniem swoich planów, stworzyło bardziej znaczące wrażenia klientów w celu ponownego ich zaangażowania i zwiększyło współczynniki utrzymania z 2% do 10%.

    Te liczby nie mają na celu pochwalić się wynikami konkretnej firmy marketingowej. Znajdziesz wiele startupów i większych organizacji, które mogą osiągnąć podobne wyniki. Jeśli pomysł osiągnięcia tego rodzaju wyników w Twojej organizacji przyprawia Cię o gęsią skórkę, nie jesteś sam. Zobaczmy, jak można to zrobić możliwie. Marketing to złożona funkcja, więc zamiast wymieniać wszystkie możliwe zastosowania, skupimy się na trzech ogólnych problemach, które dotyczą większości firm:

    •  Określenie, którzy klienci prawdopodobnie opuszczą Twoją usługę (maselnica)
    •  Określenie, którzy klienci są skłonni kupić nową usługę (sprzedaż dodatkowa)
    •  Identyfikacja podobnych grup klientów (segmentacja klientów)


    Przewidywanie odchodzących klientów

    Jednym z najważniejszych wskaźników marketingowych jest odpływ klientów (znany również jako odpływ lub rotacja klientów ). Rezygnacja jest zdefiniowana jako odsetek klientów opuszczających firmę w określonym czasie. Czy nie byłoby wspaniale wiedzieć wcześniej, którzy klienci są najbardziej niezadowoleni i najprawdopodobniej porzucą produkt lub usługę w najbliższej przyszłości? Właśnie w ten sposób sztuczna inteligencja może pomóc Ci rozwiązać problem odpływu klientów: korzystając z uczenia maszynowego i zasobów danych organizacji, możemy znaleźć klientów, którzy z największym prawdopodobieństwem opuszczą Twoją usługę i dotrzeć do nich ze spersonalizowanymi wiadomościami, aby przyciągnąć ich zaangażowanie się ponownie. Następnie pokażemy, jak działa predyktor rezygnacji, dając Ci pewność, że zobaczysz możliwości dla tej aplikacji w Twojej organizacji. W tym problemie z uczeniem maszynowym mamy dwie klasy klientów: tych, którzy prawdopodobnie odejdą, i tych, którzy tego nie zrobią. Dlatego etykietą, którą nasz model ML będzie musiał nauczyć się przewidywać, jest to, czy klient należy do jednej klasy, czy do drugiej (załóżmy, że klienci, którzy mają zamiar odejść, należą do klasy 1, a pozostali należą do klasy 0). Na przykład firma telekomunikacyjna może oznaczyć "odszedłem" wszystkich klientów, którzy zrezygnowali z jej planu telefonicznego, a "nie odeszli" wszystkich pozostałych, którzy nadal korzystają z jego planu. Teraz, gdy zdefiniowaliśmy etykietę, którą nasz algorytm musi przewidzieć, przyjrzyjmy się, jakich funkcji możemy użyć. Pamiętaj, że cechy w problemie ML to parametry, na które model będzie zwracał uwagę, aby rozróżnić klasy. Może to być atrybut użytkownika (np. dane demograficzne) lub jego interakcja z Twoim produktem (np. liczba wejść na daną usługę w ciągu ostatniego miesiąca). To, co właśnie opisaliśmy, ma postać problemu nadzorowanego uczenia się: algorytm ML jest proszony o nauczenie się mapowania między zestawem cech (charakterystyka klienta) a etykietą (zrezygnowano/niezrezygnowano) na podstawie danych historycznych. Podsumujmy kroki niezbędne do rozwiązania tego problemu

    1. Zdefiniuj zadanie ML zaczynając od biznesowego (identyfikując klientów, którzy prawdopodobnie opuszczą naszą usługę).

    2. Wyraźnie zidentyfikuj etykietę: odrzucona lub niezmieniona.

    3. Zidentyfikuj cechy: elementy klienta, które mogą wpływać na prawdopodobieństwo odejścia. Możesz wymyślić możliwe przykłady, myśląc o tym, na co byś spojrzał, gdybyś musiał wykonywać tę pracę sam

    4. Wiek

    5. Jak długo klient korzystał z usługi?

    6. Pieniądze wydane na usługę

    7. Czas spędzony na korzystaniu z usługi w ciągu ostatnich dwóch miesięcy

    8. Zbierz dane historyczne odchodzących i aktywnych klientów.

    9. Trenuj model: model ML nauczy się przewidywać etykietę, biorąc pod uwagę cechy.

    10. Przeprowadź wnioskowanie: użyj modelu na nowych danych, aby określić, którzy z Twoich obecnych klientów prawdopodobnie odejdą.

    Zwróć uwagę, że etykieta musi zostać odnaleziona z mocą wsteczną, patrząc na przeszłe zapisy klientów. Rozważmy najpierw najłatwiejszą sytuację. Załóżmy, że masz model biznesowy oparty na subskrypcji, taki jak Netflix lub Spotify. Subskrypcje odnawiają się zwykle automatycznie, więc klienci muszą aktywnie podjąć działania w celu anulowania abonamentu: zadzwonić do obsługi klienta w przypadku firmy telefonicznej lub wejść na stronę i wyłączyć automatyczne odnawianie w przypadku Netflix lub Spotify. W takich sytuacjach znalezienie etykiety jest łatwe: nie ma wątpliwości, czy klient jest nadal na pokładzie, czy nie, a istnieje przejrzysta tabela bazy danych, która może dokładnie powiedzieć, kiedy to się stało. Inne modele biznesowe są bardziej złożone. Załóżmy, że jesteś kierownikiem marketingu supermarketu i używasz kart lojalnościowych do śledzenia klientów za każdym razem, gdy wchodzą i robią zakupy. Najprawdopodobniej klient, który znalazł lepszy supermarket, nie zadzwoni do ciebie i powie: "Przy okazji, chcę tylko poinformować, że nie wrócę ponownie do twojego supermarketu". Zamiast tego ta osoba prawdopodobnie już się nie pojawi i to wszystko! Brak śladów, brak kolumny Unsubscribed w Twojej bazie danych, brak łatwej etykiety. Czy nadal możesz znaleźć sposób na przypisywanie etykiet takim klientom? Oczywiście że możesz. Powszechnym i prostym sposobem na to jest przyjrzenie się wzorcom zakupów i zobaczenie, kiedy nagle się zmieniają. Załóżmy, że w każdą niedzielę bardzo lojalna rodzina przychodzi po zakupy spożywcze. Jednak w ostatnim miesiącu ich nie widziałeś. Możesz założyć, że postanowili już nie przychodzić, i dlatego oznacz ich jako "odrzuconych". Czy jeden miesiąc to właściwy próg? Trudno powiedzieć bez dodatkowego kontekstu, ale na szczęście nie jest to twoja praca: zostaw zadanie rozpracowania danych analitykom danych. Ważne jest, abyś zrozumiał, że niezależnie od firmy, jeśli masz powracających klientów - i zebrałeś dane o ich interakcjach - prawdopodobnie istnieje sposób na zdefiniowanie rezygnacji i zidentyfikowanie, kto odszedł, a kto jest nadal aktywny. Kiedy już wymyślisz jakieś etykiety, aby odróżnić "szczęśliwych klientów" od tych, którzy odeszli, sytuacja staje się podobna do przykładu przewidywania ceny domu, który widzieliśmy wcześniej. Na szczęście dane szkoleniowe do przewidywania rezygnacji można łatwo wyodrębnić z systemu zarządzania relacjami z klientami (CRM) firmy. Mówiąc dokładniej, możemy wyodrębnić dane CRM z okresu do, powiedzmy, 18 miesięcy temu, a następnie oznaczyć, czy klienci zrezygnowali w ciągu ostatnich 6 miesięcy. Do tej pory jesteś już znacznie bardziej pewny siebie i skuteczny w definiowaniu etykiety dla projektu prognozowania rezygnacji niż większość menedżerów biznesowych. Każdy analityk danych będzie za to wdzięczny, ale jeśli naprawdę chcesz im pomóc, musisz włożyć dodatkowy wysiłek: pomóc im w wyborze funkcji. Jeśli brzmi to jak szczegół techniczny, tracisz świetną okazję, aby zabłysnąć swoim doświadczeniem i wiedzą o domenie. W przypadku problemu z ML pamiętaj, że cecha jest atrybutem zjawiska, które próbujemy modelować, i wpływa na jego wynik. Zakładając, że jesteś ekspertem ds. marketingu, nikt na świecie nie ma lepszego wglądu w odpowiednie funkcje, a Twoja wiedza może pomóc Twojemu zespołowi zajmującemu się analizą danych podążać ścieżką prowadzącą do pomyślnych wyników. Aby zorientować się, jak może wyglądać Twój wkład, zadaj sobie pytanie: "Gdybym miał odgadnąć prawdopodobieństwo odejścia tylko jednego klienta, na jakie parametry bym spojrzał?" Może to poinformować rozmowa z inżynierem:

    Inżynier: Czy wiesz, co wpływa na odejście klientów? Muszę wymyślić kilka istotnych funkcji.

    Marketer: Jasne, wiemy, że konfiguracja płatności ma duże znaczenie dla rezygnacji. Zwykle ktoś, kto ma umowę zamiast karty przedpłaconej, jest mniej skłonny do rezygnacji z usługi, ponieważ ma większe uzależnienie. Prawdą jest również, że kiedy zbliżamy się do daty wygaśnięcia umowy, klienci zaczynają patrzeć na konkurencję, więc to kolejny czynnik.

    Inżynier: Interesujące. Na pewno użyję funkcji w modelu, która wyraża "umowa" lub "przedpłata". Kolejną cechą będzie liczba dni do wygaśnięcia umowy. Coś jeszcze?

    Marketer: Jasne, wiemy, że wiek odgrywa dużą rolę. Ci młodzi millenialsi cały czas zmieniają firmy, podczas gdy starsi ludzie są bardziej lojalni. Ponadto, jeśli ktoś jest naszym klientem od dłuższego czasu, to dobry wskaźnik lojalności.

    Inżynier: Ładnie, możemy zajrzeć do CRM i dodać funkcję "dni od rejestracji" i jedną dla wieku. Czy wiek jest jedynym interesującym atrybutem demograficznym?

    Marketer: Nie sądzę, że płeć jest; nigdy nie zauważyliśmy żadnego wpływu. Zawód jest ważny: wiemy, że samozatrudnieni mniej chętnie zmieniają plany.

    Inżynier: OK, spróbuję sprawdzić, czy płeć ma jakikolwiek związek z odejściem. Jeśli chodzi o zawód, to dobra wskazówka. Dzięki!

    Taka rozmowa może trwać całymi dniami, zwykle z ciągłym przepychaniem się między inżynierami a tobą. Przekażesz swoje doświadczenie i wiedzę domenową, a inżynier przełoży to na coś czytelnego dla maszyny. W końcu inżynier powróci z pewnymi spostrzeżeniami lub pytaniami wynikającymi z analizy danych, które wymagają Twojej pomocy w interpretacji. Jak widać, nie jest to ćwiczenie dla nerdów: to praca zespołowa między biznesem a nerdami.


    Wykorzystanie sztucznej inteligencji do zwiększenia współczynników konwersji i sprzedaży dodatkowej

    Widziałeś, jak przewidywanie rezygnacji może być potężnym zastosowaniem algorytmów klasyfikacji. W tym przypadku klasy, którymi oznaczamy klientów, to "odeszli" lub "nie odeszli". W innych sytuacjach możesz oznaczyć klientów klasą, która jest odpowiednia dla Twojego działu marketingu i użyć algorytmów ML do przewidywania. Naturalnym jest to, czy klient kupi usługę na podstawie wcześniejszej sprzedaży. Wyobraźmy sobie, że masz klasyczny lejek marketingowy: klienci subskrybują bezpłatną usługę, a następnie niektórzy z nich przechodzą na usługę premium. Masz zatem dwie klasy klientów:

    •  Przekonwertowani - Klienci, którzy kupili usługę premium po wypróbowaniu darmowej wersji
    •  Brak konwersji - Klienci, którzy nadal korzystali z bezpłatnej usługi

    Firmy internetowe mogą w końcu zainwestować miliony, aby zmaksymalizować liczbę użytkowników, którzy przechodzą na płatny produkt. Ta miara jest święta dla firm programistycznych, które mają model biznesowy Software as a Service (SaaS): firm oferujących usługi zakupione w ramach subskrypcji. W zależności od współczynnika konwersji firma korzystająca z subskrypcji internetowej może przeżyć lub umrzeć. Najbardziej naiwnym sposobem na zwiększenie współczynnika konwersji płacących użytkowników jest masowe ukierunkowanie działań marketingowych na całą bazę użytkowników: biuletyny, oferty, bezpłatne wersje próbne i tak dalej. Bardziej wyrafinowani marketerzy mogą pomyśleć o stworzeniu rozbudowanych strategii, aby ocenić prawdopodobieństwo konwersji i mądrzej zainwestować budżet marketingowy. Na przykład możemy sądzić, że użytkownik, który otworzył biuletyn, jest bardziej zainteresowany zakupem usługi premium niż użytkownik, który nigdy żadnej nie otworzył, i kieruje do niego reklamy na Facebooku (czy kiedykolwiek zostałeś spamowany na Facebooku po odwiedzeniu strony internetowej lub otwarciu biuletyn?). Biorąc pod uwagę wagę tematu i ilość pieniędzy, które na nim płyną, zobaczmy, czy możemy użyć ML do sklasyfikowania użytkowników według ich prawdopodobieństwa konwersji, optymalizacji naszych kosztów marketingowych i osiągania lepszych wyników. Jeśli przyjrzysz się problemowi, zobaczysz, że idealnie nadaje się do uczenia maszynowego. Widziałeś już, że masz jasno określone zadanie: identyfikację użytkowników, którzy mogą przejść z usługi bezpłatnej na płatną. To jest nadzorowane zadanie klasyfikacji uczenia i masz gotowe etykiety: powiedzmy 1 dla użytkowników, którzy kupili płatną usługę, i 0 dla użytkowników, którzy tego nie zrobili. Teraz musisz pomyśleć o funkcjach, których użyjesz do wytrenowania swojego klasyfikatora. Pamiętaj, że dobrym punktem wyjścia do identyfikacji cech jest zadanie sobie pytania: "Gdybym sam musiał odgadnąć prawdopodobieństwo konwersji, jakich informacji bym potrzebował?" Informacje te mogą obejmować:

    •  Korzystanie z bezpłatnego produktu. Pamiętaj, że musi to być rzeczywista liczba, więc musisz wymyślić użyteczny sposób, aby to opisać. Jeśli sprzedajesz usługę taką jak Dropbox, użycie można opisać kilkoma parametrami:

    •  Liczba przechowywanych plików
    •  Liczba urządzeń, z których zalogowali się użytkownicy (podpowiada, jak przydatna jest usługa dla użytkownika)
    •  Liczba wejść na dzień/tydzień/miesiąc (wskazuje, jak często korzysta z niej użytkownik)
    •  Wskaźniki otwarć newslettera (Jak zainteresowany jest użytkownik naszą wiadomością?)
    •  Jak dawno temu użytkownik zasubskrybował?
    •  Kanał pozyskiwania (Ktoś, kto zasubskrybował po skierowaniu znajomego, może być bardziej wartościowy niż ktoś, kto kliknął reklamę na Facebooku).

    Zmienne te mogą się różnić w zależności od rodzaju prowadzonej działalności, ale koncepcja jest generalnie prosta: zastanów się, jakie czynniki mogą wskazywać na prawdopodobieństwo konwersji, a następnie dodaj je do algorytmu ML. Warto zaznaczyć, że niektóre firmy mają więcej danych niż inne: na przykład serwisy internetowe korzystające z loginu Facebook będą mogły poznać wszystkie zainteresowania swoich użytkowników jako funkcje takich klasyfikatorów. Zakładając, że masz dane historyczne dotyczące wcześniejszych klientów, którzy dokonali konwersji, oraz tych, którzy nie dokonali konwersji, możesz wytrenować swój algorytm, aby określić, w jaki sposób wybrane funkcje wpływają na prawdopodobieństwo zakupu Twojej usługi premium przez użytkownika. Gdy faza szkolenia jest jedna, Twój algorytm jest w końcu gotowy do zastosowania tego, czego nauczył się od poprzednich klientów, do obecnych klientów, ustawiając ich od najbardziej prawdopodobnych do najmniej prawdopodobnych. Jak pamiętasz z poprzedniego rozdziału, ta faza nazywa się wnioskowaniem (przewidywanie nowych danych po nauczeniu algorytmu na danych z przeszłości). Zauważ, że zastosowaliśmy tę metodologię w przypadku systemu internetowego, który korzysta z modelu freemium (usługa bezpłatna i płatne uaktualnienie), ale można ją zastosować w każdym innym przypadku, w którym grupa klientów wykonuje jedną czynność oraz inna grupa robi coś innego (lub nic). Ten scenariusz jest wspólny i zachęcamy do szukania takich sytuacji i zastanowienia się, czy jest miejsce na zbudowanie dla nich klasyfikatora ML. Aby dać ci inspirację, oto kilka innych przypadków, w których możesz zastosować tę metodologię:

    •  Masz podstawowy produkt i niektóre dodatki (akcesoria lub dodatkowe usługi, które są wspólne dla firm telekomunikacyjnych).
    •  Możesz oznaczyć klientów etykietą "kupił up-sell X " lub "nie kupił up-sell X " i użyć ich podstawowych produktów, aby ocenić, czy warto zaproponować up-sell swojemu klientowi.
    •  Masz newsletter i chcesz zoptymalizować jego stawki otwarć. Twoje etykiety to "otwarły biuletyn" lub "nie otworzyły biuletynu". Funkcje, których używasz w klasyfikatorze, mogą obejmować czas wysłania wiadomości e-mail (dzień tygodnia, godzina itd.) oraz niektóre funkcje związane z użytkownikiem, a także możesz oznaczać wiadomości e-mail według ich treści (na przykład "informacyjne, " "wiadomości produktowe" lub "biała księga").
    •  Masz sklep fizyczny z kartą lojalnościową (aby śledzić, który klient co kupuje). Możesz uruchamiać inicjatywy marketingowe (ponownie biuletyny lub reklamy fizyczne) i klasyfikować użytkowników na podstawie tego, co sprowadziło ich do Twojego sklepu, a co nie.

    Jak widać, metoda, którą właśnie opisaliśmy, polegająca na podzieleniu użytkowników na dwie oddzielne klasy i zbudowaniu klasyfikatora ML, który potrafi je rozpoznać, jest dość elastyczna i może być stosowana w wielu problemach. Całkiem potężne, prawda?


    Wykonywanie automatycznej segmentacji klientów

    We wstępie odnieśliśmy się do jednej z kluczowych czynności, które marketerzy muszą wykonać podczas opracowywania planu marketingowego: segmentacji klientów. Segmentacja rynku oznacza dzielenie na grupy klientów o podobnych cechach i zachowaniach. Główną ideą tego wysiłku jest to, aby klienci z tej samej grupy reagowali na podobne działania marketingowe. Na przykład sprzedawca odzieży prawdopodobnie skorzystałby na osobnych segmentach rynku dla mężczyzn i kobiet oraz nastolatków i młodych dorosłych i profesjonalistów. Segmenty mogą być mniej lub bardziej szczegółowe, a zatem mniej lub bardziej szczegółowe. Oto dwa przykłady:

    •  Szeroki segment - młodzi mężczyźni w wieku od 20 do 25 lat
    •  Bardzo specyficzny segment - młodzi mężczyźni w wieku od 20 do 25 lat, studiujący na studiach, mieszkający w jednym z pięciu największych miast USA i pasjonujący się grami wideo FPS

    Wielu marketerów może intuicyjnie wykonać to zadanie segmentacji w swoich mózgach, o ile ilość danych jest ograniczona, zarówno pod względem przykładów (liczba klientów), jak i funkcji. Zwykle tworzy to ogólne segmenty klientów, takie jak pierwszy, co może być ograniczeniem, biorąc pod uwagę stopień zróżnicowania występującego między tymi grupami. Marketer mógłby próbować zdefiniować bardziej konkretny segment, taki jak drugi, ale jak to wymyślić? Oto pytania, które można by zadać podczas typowej sesji burzy mózgów:

    •  Czy dobrym pomysłem jest stosowanie progu 20-25 lat, czy lepiej 20-28 lat?
    •  Czy jesteśmy pewni, że studenci mieszkający w dużych miastach zasadniczo różnią się od tych mieszkających w mniejszych? Czy nie możemy umieścić ich wszystkich w jednym klastrze?
    •  Czy istnieje zasadnicza różnica między mężczyznami a kobietami? Czy naprawdę musimy stworzyć dwa segmenty, czy to tylko banał?

    Odpowiedzi na te pytania można uzyskać na trzy sposoby:

    •  Kieruj się instynktem. Nie jesteśmy w 1980 roku, więc nie rób tego.
    •  Spójrz na dane i użyj instynktu marketera, aby je zinterpretować. To lepsze niż przeczucie, ale marketerzy prawdopodobnie przeniosą swoje uprzedzenia na swoją analizę i zobaczą to, co chcą zobaczyć. Więc tego również unikaj.
    •  Pozwól sztucznej inteligencji samodzielnie wymyślić segmenty klientów, informując marketera, aby mógł wykorzystać swoją kreatywność i znajomość kontekstu.

    Opcja 3 najprawdopodobniej przewyższy pozostałe. Zobaczmy, dlaczego i jak.


    Nauka nienadzorowana (lub grupowanie)

    Przyjrzyjmy się problemowi, który właśnie opisaliśmy: Od czego zaczynamy: pula klientów, z mnóstwem elementów, które ich charakteryzują (wiek, lokalizacja, zainteresowania itd.) Czego chcemy: pewna liczba segmentów, których możemy użyć podzielić naszych klientów Możesz sobie wyobrazić ten problem jako posiadanie grupy klientów i konieczność umieszczenia każdego z nich w wiązce, którą nazwiemy klastrem



    Cechy klientów, których będziemy używać, przypominają to, co nazywaliśmy funkcjami wcześniej, więc możesz pomyśleć, że mamy do czynienia z tym samym rodzajem zadania i możemy korzystać z tych samych narzędzi, które już opisaliśmy. Ale diabeł tkwi w szczegółach: ponieważ nie znamy z góry grup, które chcemy zdefiniować, nie wiemy, które etykiety zastosować. Do tej pory w książce używaliśmy podzbioru uczenia maszynowego zwanego uczeniem nadzorowanym. Typowa recepta na nadzorowane zadanie uczenia się jest następująca:

    1. Posiadamy dane o grupie klientów charakteryzujących się określonymi cechami.
    2. Ci klienci mają również etykietę: wartość docelową, którą chcemy przewidzieć (na przykład, czy odeszli, czy nie).
    3. Nadzorowany algorytm uczenia przechodzi przez dane klientów i uczy się ogólnego mapowania między funkcjami a etykietami.

    W naszym nowym scenariuszu brakuje punktu 2: nie mamy etykiety dołączonej do każdego użytkownika. Właśnie to chcemy, aby nasz nowy algorytm znalazł. Dlatego tak wygląda nasze nowe zadanie:

    1. Tak jak poprzednio, dysponujemy danymi o gronie klientów charakteryzujących się określonymi cechami.
    2. Chcemy podzielić klientów na określoną liczbę segmentów (klastrów) - powiedzmy trzy z nich.
    3. Uruchamiamy jakiś algorytm ML, który patrząc na dane, określa najlepsze klastry, jakie możemy wymyślić i dzieli na nie użytkowników.

    Ten nowy rodzaj algorytmu ML nazywa się grupowaniem lub uczeniem nienadzorowanym. Uczenie nienadzorowane to kolejna forma uczenia maszynowego, w której algorytm jest zasilany zestawem nieoznaczonych przykładów (tylko zestaw parametrów) i jest proszony o podzielenie przykładów na grupy, które mają pewne podobieństwo. W tym sensie nienadzorowane algorytmy uczenia się wykorzystują koncepcję podobieństwa, aby przezwyciężyć brak wcześniej zdefiniowanej etykiety, dzieląc przykłady, które są karmione na grupy w sposób autonomiczny. Jest to podstawowa różnica między uczeniem nadzorowanym i nienadzorowanym: algorytmy uczenia nadzorowanego uczą się mapowania między zestawem cech i etykiet, podczas gdy algorytmy nienadzorowane po prostu patrzą na etykiety i grupują punkty danych w klastrach, które mają pewne podobieństwo, jak pokazano na rysunku



    Zadanie znalezienia podobnych grup w zestawach danych jest dość proste, gdy wymiary, które musimy wziąć pod uwagę, są ograniczone. Spójrz na rysunek i zobaczysz, że punkty naturalnie kondensują się w dwie dobrze oddzielone grupy.



    Ale co się dzieje, gdy chcemy wziąć pod uwagę dużą liczbę cech użytkownika? Jeśli chcemy rozważyć, powiedzmy, 10 atrybutów, nasze umysły nie są w stanie zidentyfikować grup, które są do siebie podobne. Właśnie wtedy błyszczą algorytmy nienadzorowanego uczenia się: mogą bez problemu skalować pojęcie podobieństwa nawet do setek wymiarów, a my możemy wykorzystać wyniki do uzyskania przydatnych informacji. W tej chwili powinieneś mieć przeczucie, dlaczego rodzaj ML, którego używaliśmy do tej pory, nazywa się nadzorowany: nasze algorytmy zostały poproszone o mapowanie danego zestawu funkcji do danego zestawu etykiet. Ponieważ nie mamy od początku żadnych etykiet, algorytm musi je znaleźć sam, w nienadzorowany sposób. Możesz o tym pomyśleć w ten sposób: W nadzorowanym uczeniu się już wiesz, czego szukasz. Jeśli możesz klasyfikować klientów do różnych klas (na przykład, którzy odeszli/nie odeszli, tak jak robiliśmy to wcześniej), algorytm ML może nauczyć się rozpoznawać klientów należących do jednej lub drugiej klasy. W nauce nienadzorowanej nie wiesz dokładnie, czego szukasz: nie możesz przypisać etykiety klientom. Algorytm uczenia nienadzorowanego rozpozna grupy podobnych klientów i przypisze im etykietę. Nie powie ci jednak, co oznacza ta etykieta: algorytm powie tylko, że klienci z etykietą A są do siebie podobni i różnią się od klientów z etykietą B; to od Ciebie zależy, czy zrozumiesz, dlaczego. Zobaczmy, jak potoczy się rozmowa między ekspertem ML a marketerem:

    Marketer: Szukam sposobów, w jakie ML może pomóc naszemu zespołowi poprawić segmentację klientów.
    Ekspert ML: Jak wcześniej robiłeś segmentację klientów?
    Marketer: Wiesz, "stary dobry sposób": użycie mieszanki ankiet, doświadczenia i przeczucia. Wiem, że jest kilka technik ML, które mogą w tym pomóc.
    Ekspert ML: Tak, mogę używać uczenia nienadzorowanego do automatycznego generowania klastrów. Zacznijmy od czegoś prostego: jakie są trzy najważniejsze elementy, które są istotne dla segmentacji naszych klientów?
    Marketeer: Na pewno dane demograficzne, takie jak wiek i płeć, dodałbym do tego średnie miesięczne wydatki. To dobry wskaźnik prawdopodobieństwa zakupu od nas nowych usług.
    Ekspert ML: Miło. Dostanę eksport z naszego CRM o tych wymiarach dla 1000 klientów i oddzwonię do Ciebie. Potrzebuję twojej pomocy w interpretacji wyników.

    [Po chwili]

    Ekspert ML: Zrobiłem kilka wstępnych grupowań i wygląda na to, że mamy trzy dobrze zdefiniowane klastry: młodzi mężczyźni o niskich wydatkach, kobiety o wysokich wydatkach po trzydziestce i jeden, który jest pomiędzy.
    Marketeer: Ciekawe - nie wiedzieliśmy, że kobiety po trzydziestce są dla nas tak dochodowym segmentem. Chciałbym kopać głębiej; czy możemy dodać kolejny wymiar do grupowania? Interesuje mnie częstotliwość ich zakupów: wiemy, że kobiety lubią kupować częściej niż mężczyźni i zastanawiam się, czy nauka bez nadzoru może się podnieść coś głębszego.
    Ekspert ML: Jasne, zdefiniujmy etykietę, która jest "średnim czasem między zamówieniami". Przyjrzę się wynikom.

    Jako osoba biznesowa ważne jest, abyś rozpoczynał te rozmowy z pewną wiedzą na temat uczenia się bez nadzoru, dzięki czemu możesz prowadzić konstruktywną dyskusję z osobami technicznymi i z otwartym nastawieniem, które może zaakceptować dane wejściowe, które są przekazywane przez nich. Dobrym sposobem na wizualizację gromad jest zobrazowanie, jak gwiazdy są rozrzucone na nocnym niebie. Nasz mózg intuicyjnie grupuje sąsiednie gwiazdy i przypisuje im znaki zodiaku. Większość rzeczywistych aplikacji jest nieco bardziej złożona z trzech głównych powodów: *Czasami punkty danych są rozmieszczone jednorodnie, co utrudnia podjęcie decyzji o tym, ile klastrów należy wziąć pod uwagę, nie mówiąc już o tym, jak podzielić klientów.

    •  Jako ludzie z łatwością przeprowadzamy segmentację w ograniczonych wymiarach, ale mamy problemy, gdy liczba wymiarów wzrasta. Wróćmy do przykładów znaków zodiaku: widzimy niebo jako dwuwymiarowe płótno; wykonanie tego samego zadania w przestrzeni trójwymiarowej byłoby znacznie trudniejsze. W czterech wymiarach byłoby to niemożliwe. A co z 20 wymiarami informacji o kliencie?
    •  Z biznesowego punktu widzenia segmentacja nie jest pustym ćwiczeniem, ale jest najbardziej przydatna tylko wtedy, gdy różne segmenty można powiązać z wynikami biznesowymi, często pod względem wartości życiowej klienta, wrażliwości na cenę lub preferencji kanału.
    W następnej sekcji zajmiemy się tymi problemami na przykładzie. Na razie przyjrzyjmy się nieco głębiej w nakrętce i śrubie klastrowania. Jedną z pierwszych ważnych decyzji, które należy podjąć podczas rozwiązywania problemu klastrowania, jest decyzja, które funkcje (lub wymiary) należy użyć do klastrowania. W naszym trywialnym przykładzie nocnego nieba wybór wymiarów jest oczywisty: pozioma i pionowa pozycja każdej gwiazdy. Jednak aplikacje w świecie rzeczywistym mogą być znacznie bardziej złożone.


    Nienadzorowana nauka segmentacji klientów

    Ta sekcja zawiera więcej szczegółów na temat uczenia się bez nadzoru i rzuci trochę światła na wewnętrzne działanie tych algorytmów. Podstawowe pojęcia, których się do tej pory nauczyłeś, wystarczą, aby wyobrazić sobie nowe aplikacje do nienadzorowanej nauki w Twojej organizacji. Jeśli to wystarczy do Twoich celów, możesz pominąć tę sekcję. Jeśli chcesz dowiedzieć się więcej o tym, jak korzystać z tych technik w praktyce, czytaj dalej. Posłużmy się przykładem serwisu e-commerce, który sprzedaje obuwie i ma dostęp do historii zakupów swoich klientów. Każdy punkt danych reprezentuje zakup lub zwrot i zawiera informacje o bucie, takie jak cena, marka, rozmiar, kolor, data i godzina transakcji oraz czy został kupiony razem z innymi przedmiotami. Możemy zdecydować się na wykorzystanie wszystkich tych funkcji do segmentacji lub ograniczyć naszą analizę do podzbioru. Na przykład przyjrzenie się kolorom wszystkich butów, które klient kupił, może pomóc nam lepiej zrozumieć jego gust, a spojrzenie na porę dnia na te zakupy może dostarczyć sugestii dotyczących najlepszej pory dnia na proponowanie rabatów. Moglibyśmy nawet ekstrapolować parametry, takie jak średnia kwota wydana na zakup i liczba butów kupionych w ciągu miesiąca. Te dwie informacje razem wzięte prawdopodobnie pomogłyby algorytmowi grupowania znaleźć naturalne rozróżnienie między klientami o wysokiej częstotliwości/niskiej wartości a klientami o niskiej częstotliwości/wysokiej wartości. Dla uproszczenia załóżmy, że budujemy prosty algorytm grupowania, który analizuje trzy cechy każdego klienta:

    Wiek
    Płeć
    Średnie miesięczne wydatki na e-commerce

    Należy pamiętać, że atrybuty, które nie są używane do grupowania, nie są odrzucane, ale można je wykorzystać do profilowania. Oznacza to opisanie cech każdej grupy w celu podjęcia decyzji marketingowych. Tabela 1 przedstawia nasze dane dla pierwszych pięciu klientów.

    Identyfikator klienta : Wiek : Płeć : Średnie miesięczne wydatki ($)

    1 : 18 : M : 14,67
    2 : 21 : M : 15,67
    3 : 28 : M : 18,02
    4 : 27 : przód : 34,61
    5:32:F:30,66

    W niektórych z najczęściej używanych algorytmów klastrowania następnym krokiem byłoby określenie liczby klastrów, których szukamy. Często jest to sprzeczne z intuicją: w końcu czy nie chciałbyś, aby algorytm powiedział ci, ile jest grup użytkowników? Jeśli jednak się nad tym zastanowisz, istnieje wiele sposobów na podzielenie populacji na kawałki, a wybór liczby klastrów z góry jest jedynym sposobem na kierowanie algorytmem. Na razie uprośćmy sprawę i powiedzmy, że chcemy uzyskać trzy klastry. Algorytm grupowania znajdzie sposób na podzielenie użytkowników w taki sposób, aby Klienci w ramach tego samego klastra byli do siebie podobni. Klienci w różnych klastrach różnią się od siebie. W ten sposób mamy matematyczną pewność, że wybierając akcję skierowaną do klientów z określonego klastra, maksymalizujemy prawdopodobieństwo, że zareagują w ten sam sposób. Warto przyjrzeć się dwóm wynikom algorytmu grupowania:

    •  Klaster, który zostanie powiązany z każdym użytkownikiem, jak wskazano w tabeli 2.
    •  Centra klastrowe. Każdy klaster ma centrum, które można uznać za "stereotyp" rodzaju użytkownika, który należy do tego klastra. Marketer nazwałby to personą kupującego.

    Identyfikator klienta : Wiek : Płeć : Średnie miesięczne wydatki ($) : Klaster

    1 : 18 : M : 14,67 : 1
    2 : 21 : M : 15,67 : 1
    3 : 28 : M : 18,02 : 3
    4:27:P:34,61:2
    5 : 32 : F : 30,66 : 2

    Spojrzenie na centra klastrów ma kluczowe znaczenie, ponieważ daje nam informacje ilościowe na temat tego, co znalazł algorytm, które możemy następnie zinterpretować w celu wyodrębnienia spostrzeżeń. Każde centrum będzie charakteryzować się tymi samymi trzema cechami, których używaliśmy wcześniej do opisywania użytkowników (choć możemy je zmienić, aby były bardziej znaczące). Zazwyczaj dodamy również liczbę użytkowników należących do każdego klastra. Tabela 3 pokazuje, jak mogą wyglądać centra klastrowe, przy założeniu, że zaczęliśmy od danych od 1000 klientów.

    Numer klastra: Wiek: % kobiety: Średnie miesięczne wydatki ($): Liczba klientów

    1 : 18,2 : 20% : 15,24 : 290
    2 : 29,3 : 90% : 28,15 : 120
    3 : 22 : 40% : 17,89 : 590

    Ta pozornie nieszkodliwa tabela jest pełna przydatnych informacji. Poświęćmy trochę czasu na ekstrapolację spostrzeżeń i poznanie naszych segmentów:

    •  Cluster 1 składa się głównie z młodych (średnia wieku: 18,2), głównie mężczyzn, którzy nie wydają dużych pieniędzy (średnie miesięczne wydatki to 15,24 USD). Jest to klaster o średniej wielkości (jest tutaj 29% użytkowników).
    •  Cluster 2 skłania się ku starszym kobietom (średnio 29,3 lat), które wydają znacznie więcej niż jakikolwiek inny klaster (średnie wydatki 28,15 USD w porównaniu z odpowiednio 15,24 USD i 17,89 USD w klastrach 1 i 3). To raczej niewielki segment, do którego należy 12% użytkowników.
    •  Cluster 3 jest prawie równo podzielone na samce i samice. Nie są tak oszczędni i młodzi jak skupienie 1, ale zdecydowanie wydają mniej niż skupienie 2 i są znacznie młodsi (22 lata w porównaniu z 29,3).

    Marketerzy mogą dobrze wykorzystać te informacje i wymyślić spersonalizowane strategie, aby sprzedawać produkty każdej grupie ludzi. Na przykład klientom z klastrów 1 i 3 można oferować tańsze produkty w porównaniu z tymi z klastra 2. Dodanie nowych funkcji, takich jak kolory kupowanych butów, może dać nam więcej informacji, aby móc podejmować bardziej precyzyjne decyzje. Zwróć uwagę, jak proces rozpoczął się od danych i ustaleń algorytmu na jego temat, ale zakończył się, gdy człowiek spojrzał na wyniki i zinterpretował centra klastrów w celu wyodrębnienia przydatnych informacji, które można podjąć. Ten aspekt jest kluczowy dla każdego algorytmu ML, ale jest szczególnie ważny dla klastrowania: prawdziwą wartość osiąga się dzięki symbiozie między tym, co może zrobić sztuczna inteligencja, a tym, co mogą na tym zbudować eksperci i ciekawscy ludzie.

    Pomiar wydajności

    Ponieważ prognozy oparte na ML mają bezpośredni wpływ na wyniki biznesowe, ocena ich wydajności jest ważną umiejętnością. Badacze i inżynierowie często opracowują dla Ciebie modele i raportują wydajność algorytmów za pomocą różnych metryk. Chociaż te metryki dobrze opisują wydajność statystyczną modeli, nie opowiadają całej historii. W rzeczywistości związek między tymi liczbami dla nerdów a wynikami biznesowymi może być subtelny. Twoim zadaniem jest zrozumienie metryk ML na tyle, aby podejmować świadome decyzje o tym, jak dokładność modelu może wpłynąć na Twoje cele biznesowe.


    Algorytmy klasyfikacji

    Dużą częścią pracy z uczeniem maszynowym jest wygodne radzenie sobie z błędami. Nawet najlepiej działający algorytm nie będzie w 100% doskonały i spowoduje błędną klasyfikację niektórych przykładów. Pamiętaj, że proces tworzenia aplikacji ML polega najpierw na przeprowadzeniu szkolenia na danych historycznych, a następnie na wykorzystaniu ich "w świecie rzeczywistym": ważne jest, aby mieć świadomość, ile błędów prawdopodobnie popełni algorytm po jego wdrożeniu i jakiego rodzaju błędów. Najprostszym i najbardziej naiwnym sposobem oceny algorytmu jest zastosowanie metryki zwanej dokładnością , która przedstawia procent poprawnych domysłów w stosunku do wszystkich przewidywań:

    Dokładność = Prawidłowe przewidywania / Łączne przewidywania

    Jednak nie wszystkie błędy są takie same. W przypadku naszego predyktora churn, możliwe są dwa błędy:

    •  Klient został błędnie oznaczony przez algorytm jako odchodzący, ale w rzeczywistości nadal jest zaangażowany. Ten przypadek nazywa się fałszywie pozytywnym (FP ).
    •  Klient został błędnie oznaczony przez algorytm jako aktywny, ale w rzeczywistości zamierza anulować swoją subskrypcję. Ten przypadek jest fałszywie ujemny (FN ).

    To rozróżnienie nie jest kolejną fiksacją dla nerdów: ma bezpośredni wpływ na biznes i ważne jest, abyś zrozumiał, jak wpłynie to na twoje decyzje biznesowe. Dobry naukowiec zajmujący się danymi nie powinien przedstawiać wyników z prostą liczbą dokładności, a ty też nie powinieneś. Lepszym pomysłem jest użycie bardziej informacyjnej tabeli. Prezentowanie wyników w tego typu tabeli jest typowe dla zadań klasyfikacji binarnej (w których etykieta ma tylko jeden z dwóch wyników - w tym przypadku odejście/brak odejścia. Badacze i inżynierowie spędzają dużo czasu przyglądając się tabelom, ponieważ zawarte w nich liczby często dają wgląd w to, jak algorytm będzie działał w prawdziwym świecie. Jako osoba, na której działalność mają wpływ te liczby, ważne jest, abyś zrozumiał niuanse, które mogą się za nimi kryć. Po pierwsze, liczba fałszywie pozytywnych i fałszywie negatywnych wyników jest powiązana ze sobą i łatwo jest wymienić jeden na drugi bez istotnych zmian w modelu lub dodatkowego szkolenia. Rozważmy na przykład bardzo naiwny model, który zawsze przewiduje, że klienci odchodzą: bez względu na to, jakie dane wejściowe otrzyma, zawsze daje wynik "tak, klient zaraz się odejdzie". Wskaźniki prawdziwie pozytywnych i fałszywie negatywnych będą zachęcające (100% tych pierwszych i 0% tego ostatniego - rozumiesz dlaczego?), ale fałszywe alarmy i prawdziwe negatywne wyniki będą okropne.

    Trudna sytuacja i jak nie dać się oszukać

    Wyobraź sobie, że budujesz swój predyktor rezygnacji na przykładowym zbiorze danych obejmującym 1000 użytkowników, podzielonym w następujący sposób:

    •  900 z nich jest aktywnych.
    •  100 z nich jest ubijanych.

    Tego rodzaju zbiory danych nazywane są niezrównoważonymi, ponieważ liczba przykładów reprezentatywnych dla jednej etykiety jest znacznie większa niż liczba przykładów reprezentatywnych dla drugiej. Załóżmy teraz, że tworzysz algorytm, który ma 90% dokładność przewidywania. Brzmi dobrze, ale czy tak jest? Jeśli zbudujesz swój algorytm do przewidywania "Aktywny" za każdym razem, będzie on poprawny w 90% przypadków (ponieważ 90% użytkowników jest aktywnych). W takim przypadku mielibyśmy:

    •  100% prawdziwych negatywów (wszystkie, które nie zostały odrzucone, są poprawnie zidentyfikowane).
    •  0% prawdziwych pozytywów (algorytm nigdy nie wykrył ani jednego odchodzącego klienta).

    W rzeczywistości twój algorytm działa słabo, mimo że jest poprawny w 90% przypadków. Jak widać, patrzenie na prawdziwe pozytywy i fałszywie negatywy jest o wiele bardziej przydatną strategią, aby uniknąć oszukania przez wysoką dokładność wyników.

    Teraz wyniki fałszywie pozytywne, fałszywie negatywne, prawdziwie pozytywne i prawdziwie negatywne są metrykami bezwzględnymi. Zawsze dobrze jest zgłosić je do metryki bezwzględnej, która nie jest wrażliwa na liczbę połączonych próbek. Mogą nam w tym pomóc dwie metryki, zwane dokładnością i przypomnieniem . Oto, co nam mówią:

    •  Precyzja - ilu spośród wszystkich klientów, których algorytm przewidział jako odchodzących (prawdziwe pozytywy), ilu naprawdę miało odejść?
    •  Przypomnij - ilu z nich odeszło ze wszystkich klientów jak algorytm mógł przewidzieć?

    Możesz sobie wyobrazić algorytm o wysokiej precyzji i niskim odwołaniu jako snajper: chce być pewien przed oddaniem strzału, więc pozostaje konserwatywny i nie strzela, dopóki nie jest pewny w 100%. Oznacza to, że nie trafia w niektóre cele, ale za każdym razem, gdy strzela, masz pewność, że trafi we właściwy cel. Z drugiej strony, algorytm o wysokim powrocie i niskiej precyzji jest jak karabin maszynowy: strzela dużo i trafia w wiele celów, w które powinien trafić, ale po drodze trafia również w niektóre niewłaściwe.


    Algorytmy klastrowania

    Jeśli chodzi o uczenie się nienadzorowane, ocena wydajności jest trudna, ponieważ nie ma obiektywnej miary "wielkości": ponieważ nie mamy etykiet do porównania, nie możemy określić, czy wynik algorytmu jest "poprawny", czy "błędny". Pamiętaj również, że większość algorytmów klastrowania wymaga zdefiniowania liczby klastrów, które chcesz zidentyfikować, więc kolejnym pytaniem, na które musisz odpowiedzieć, jest to, czy Twój wybór liczby klastrów był dobry. Jak wydostać się z tej pozornie mglistej sytuacji? Po pierwsze, niektóre narzędzia matematyczne mogą powiedzieć analitykowi danych, czy grupowanie zostało wykonane dobrze. Niestety posiadanie algorytmu, który działa świetnie z matematycznego punktu widzenia, niekoniecznie oznacza, że jest przydatny do celów biznesowych. Jeśli kupiłeś tę książkę, zakładamy, że nie używasz ML do publikowania artykułu naukowego, ale raczej do pomocy swojej organizacji. Jeśli to prawda, matematyczne akrobacje nie będą Cię interesować. Zamiast tego powinieneś spojrzeć na swoje wyniki i zadać sobie następujące pytania:

    1. Czy wyniki można interpretować? Innymi słowy, czy centra klastrów można interpretować jako persony nabywców, które mają logiczny sens? Jeśli odpowiedź brzmi tak, przejdź do pytania 2.
    2. Czy wyniki są wykonalne? Innymi słowy, czy moje klastry są na tyle różne, że mogę wymyślić różne strategie dotarcia do klientów należących do różnych centrów?

    Jeśli odpowiedź na te pytania jest twierdząca, gratulacje: możesz rozpocząć testowanie wyników w prawdziwym świecie, zbierać dane i iść naprzód, albo iterując i poprawiając swój algorytm, gdy masz więcej danych, albo wykorzystując nową wiedzę do przeprojektowania swojego zbliżać się. Na szczęście słabsze działanie nienadzorowanych algorytmów jest zwykle mniej ryzykowne niż słabsze działanie nadzorowanych algorytmów uczenia się, ponieważ pojęcie "właściwego" lub "złego" przewidywania jest bardziej mgliste. Z tego powodu nie musisz martwić się zbytnio o metryki, ale raczej o metodologię testowania, którą powinieneś mieć w celu oceny wpływu biznesowego swojego projektu.


    Powiązanie wskaźników ML z wynikami biznesowymi i ryzykiem

    Teraz, gdy już zapoznałeś się z popularnymi wskaźnikami ML, zobaczmy, co oznaczają one w scenariuszu biznesowym. Załóżmy, że wdrożyłeś świetny predyktor rezygnacji, który zidentyfikował grupę klientów, którzy prawdopodobnie opuszczą Twoją usługę, i chcesz skontaktować się ze spersonalizowanym telefonem do każdego z nich. Jeśli Twój zespół zajmujący się analizą danych zbudował model z dużą precyzją, ale niskim poziomem przypominania , nie zmarnujesz wielu połączeń telefonicznych: za każdym razem, gdy zadzwonisz, porozmawiasz z użytkownikiem, który naprawdę rozważa opuszczenie Cię. Z drugiej strony niektórzy użytkownicy opuszczają usługę, ale Twój algorytm ich nie wykrył. Algorytm o wysokim poziomie przywołania i niskiej precyzji zamiast tego sprawi, że wykonasz wiele połączeń telefonicznych - więc dotrzesz do dużej części (nawet wszystkich) klientów planujących zrezygnować z Twojej usługi, ale zmarnujesz rozmowy telefoniczne innym użytkownikom, którzy w ogóle nie planowali wypisać się. Kompromis między precyzją a pamięcią jest wyraźnie funkcją firmy. Jeśli każdy klient ma wysoką wartość, a dotarcie do niego jest tanie, postaw na wysoki poziom wycofania. Jeśli Twoi klienci nie dokonują drogich zakupów, nie chcesz, aby im niepotrzebnie przeszkadzano, a dzwonienie do nich jest drogie, skorzystaj z bardzo precyzyjnej. Jeszcze bardziej wyrafinowaną strategią może być rezerwowanie droższych działań, takich jak rozmowy telefoniczne, dla klientów o wyższej wartości lub wyższym prawdopodobieństwie rezygnacji, a korzystanie z tańszych działań, takich jak poczta e-mail, dla innych. Jak widać na rysunku 3.9, możesz zdecydować, czy skupić się na wycofaniu, czy na precyzji, w oparciu o dwa parametry: koszt utraty klienta i koszt działań, które podejmujesz, aby go zatrzymać. Problem staje się jeszcze poważniejszy w zastosowaniach krytycznych dla bezpieczeństwa. Jeśli mamy klasyfikator używany do diagnoz medycznych, koszt fałszywie dodatniego i fałszywie ujemnego jest bardzo różny. Załóżmy, że nasz algorytm wykrywa raka płuc. W tabeli możesz zobaczyć, co oznacza każdy błąd i jego konsekwencje.

    Metryka: Co to znaczy: Implikacja

    Prawdziwie pozytywne: Algorytm przewiduje, że pacjent ma raka i to prawda: pacjent naprawdę jest chory. : Pacjent natychmiast otrzymuje potrzebne leczenie.
    Prawda negatywna: Algorytm przewiduje, że pacjent jest zdrowy i rzeczywiście pacjent jest zdrowy. : Pacjent wraca do domu z ulgą.
    Fałszywe pozytywne : Algorytm przewiduje, że pacjent ma raka (stąd wynik pozytywny), ale pacjent faktycznie jest zdrowy (stąd fałsz). : Pacjent się boi i może rozpoczyna próbę, ale w rzeczywistości jest OK.
    Fałsz negatywny : Algorytm przewiduje, że pacjent jest zdrowy (negatywny), ale zamiast tego pacjent jest chory (fałsz). : Pacjent wraca do domu z ulgą, ale w rzeczywistości jest chory i nie otrzymuje potrzebnego leczenia.

    Jak widać, koszt związany z pomyłką jest bardzo różny, w zależności od tego, czy błędnie klasyfikujemy zdrowych czy chorych pacjentów. Fałszywie pozytywny może oznaczać dodatkowe badania lub niepotrzebne leczenie, ale fałszywie negatywny pozbawi pacjenta terapii desperacko potrzebnej do przeżycia. W takim scenariuszu wyraźnie widać, jak niebezpieczna jest optymalizacja pod kątem niewłaściwej metryki. Wysoka dokładność tutaj nie byłaby wskaźnikiem dobrego algorytmu, ponieważ w ten sam sposób ważyłby wyniki fałszywie ujemne i fałszywie dodatnie. W tym przypadku zależy nam na wysokim poziomie przypominania: chcemy, aby zidentyfikowano jak największą liczbę chorych pacjentów, nawet jeśli oznacza to występowanie fałszywych alarmów. Fałszywe alarmy mogą doprowadzić do dodatkowych niepotrzebnych egzaminów i przestraszyć niektóre rodziny, ale zapewnią dostrzeżenie i opiekę nad jak największą liczbą chorych. Jak widać, każdy algorytm ma wskaźnik swojej wydajności i musisz być w stanie ocenić, która metryka jest dla Ciebie najważniejsza, aby Twój zespół analityków danych mógł pracować nad jego maksymalizacją. Widzieliśmy, że najlepszy wybór nie zawsze jest oczywisty. Z biznesowego punktu widzenia najpotężniejszym pomysłem jest powiązanie każdej błędnej klasyfikacji z kwotą w dolarach. Jeśli Twoje założenia są prawidłowe, automatycznie doprowadzi to do najlepszego wyniku biznesowego. Nasza wyimaginowana firma telekomunikacyjna mogłaby opracować plan retencji dla niezadowolonych klientów, który da im premię w wysokości 100 USD, jeśli pozostaną w firmie przez następne 12 miesięcy, tym samym zachowując klienta, który w innym przypadku przeszedłby do konkurenta w najbliższej przyszłości. Z drugiej strony załóżmy, że każdy utracony klient traci dla firmy 500 dolarów zysku. Teraz, gdy mamy już wszystkie te liczby, możemy łatwo obliczyć, ile kosztują nas fałszywe negatywy i fałszywe alarmy. Każdy fałszywie negatywny wynik (klient, który przeszedł do konkurenta, zanim zdążyliśmy go skusić rabatem) kosztuje nas 500 USD utraconych przychodów. Każdy fałszywy alarm (lojalny klient, który by nie odszedł, ale i tak otrzymał prezent) kosztuje nas 100 USD utraconych przychodów. Możemy teraz użyć podstawowej rachunkowości, aby powiązać wydajność modelu z a wartość pieniężna:

    Całkowity koszt = 500 $ * FN + 0 $ * TN + 100 $ * PR + 100 $ * TP

    W tym przypadku FN to liczba wyników fałszywie ujemnych, TN to wyniki prawdziwie ujemne, FN to wyniki fałszywie ujemne, a TP to wyniki prawdziwie dodatnie. Możesz użyć tych samych pomysłów w innych sytuacjach, w których używasz binarnego modelu klasyfikacji. Załóżmy na przykład, że opracowujesz zautomatyzowany system kontroli jakości dla linii produkcyjnej. Możesz dostosować model, aby przepuścić więcej elementów (zwiększyć współczynnik wyników fałszywie ujemnych) lub od razu odrzucić więcej elementów (zwiększyć współczynnik wyników fałszywie dodatnich). Te pierwsze mogą przepuszczać więcej wadliwych elementów, prowadząc w ten sposób do większej liczby problemów na dalszych etapach procesu produkcyjnego. To ostatnie może spowodować niepotrzebne marnotrawstwo materiału, ponieważ idealnie drobne produkty są odrzucane. W każdym razie możesz dostosować poprzednią formułę do konkretnej sytuacji biznesowej. Niezależnie od przyjętej strategii, nadal musisz czuć się komfortowo z faktem, że żaden algorytm uczenia maszynowego nie będzie doskonały (jeśli tak, coś jest nie tak). Popełnisz błędy: upewnij się, że te błędy są akceptowalne i że zarówno Ty, jak i Twój algorytm uczysz się z nich.