W zależności od charakteru uczenia się, uczenie maszynowe można podzielić na trzy kategorie:
- Uczenie się bez nadzoru: etykiety nie będą nadawane używanym algorytmom uczenia się, które opuszczą algorytm w celu znalezienia własnej struktury na wejściu. Możesz wykorzystać uczenie się bez nadzoru jako cel w znajdowaniu wzorców ukrytych w danych, których używasz, lub jako środek do osiągnięcia celu.
- Uczenie się pod nadzorem: Twój komputer będzie otrzymywał dane wejściowe oraz oczekiwany wynik, dzięki czemu będzie mógł nauczyć się ogólnej zasady mapowania danych wejściowych i wyników.
- Uczenie się przez wzmacnianie: będzie program na komputer PC, który będzie współpracował z dynamicznym środowiskiem, aby osiągnąć określone cele, na przykład podczas gry przeciwko przeciwnikowi. Program będzie Ci przekazywał informacje zwrotne w formie nagród i kar w miarę poruszania się po przestrzeni problemu.
Istnieje półnadzorowane uczenie się, które można podzielić na nadzorowane i nienadzorowane. Będzie to miało miejsce wtedy, gdy będziesz dawać sygnały treningowe, które nie są kompletne w zestawie treningowym, więc program będzie musiał wykonać część pracy. Transdukcja będzie miała miejsce zawsze, gdy zasada dotyczy całego problemu, np. czasu uczenia się. Ale to nie zadziała, jeśli brakuje celów. Uczenie maszynowe obejmuje również takie kategorie, jak uczenie się, w przypadku którego program będzie uczył się indukcyjnego obciążenia programu w oparciu o doświadczenia, które miały miejsce wcześniej. Uczenie się rozwojowe będzie tożsame z uczeniem się robotów, gdzie program będzie w stanie wygenerować własną sekwencję na podstawie sytuacji uczenia się, przez które przechodzi, tak aby mógł uczyć się nowych umiejętności poprzez interakcje z ludźmi i innymi programami oraz samokształcenie. badanie.
Jeszcze inna kategoria uczenia maszynowego będzie miała miejsce, jeśli weźmiemy pod uwagę wynik działania systemu uczenia maszynowego:
- Klasyfikacja wejść zostanie podzielona na co najmniej dwie klasy, w których użytkownik będzie musiał stworzyć model, który będzie brał z tych klas wejścia, których użytkownik nie widzi. Zwykle ma to miejsce w przypadku uczenia się nadzorowanego, na przykład gdy poczta e-mail filtruje spam i nie spam.
- Odwrócenie będzie również nadzorowane, aby wyniki były ciągłe, a nie dyskretne.
- Klastrowanie polega na pobraniu zbiorów wejściowych i podzieleniu ich na różne grupy. Jednak różnica między grupowaniem a klasyfikacją polega na tym, że grupy nie będą znane użytkownikowi przed ich utworzeniem, co sprawia, że jest to zadanie bez nadzoru.
- Oszacowanie gęstości pozwoli zlokalizować rozkład wejść w tej przestrzeni.
- Redukcja wymiarowości pobiera dane wejściowe i upraszcza je, dzięki czemu można je przypisać do najniższego wymiaru.
- Modelowanie tematyczne pobiera problem z programu wstawianego przez użytkownika i ma za zadanie sprawdzić, czy wstawione dokumenty obejmują powiązane tematy.
Model klasyfikacyjnego uczenia maszynowego będzie można zweryfikować za pomocą techniki wykorzystującej szacowanie dokładności, takiej jak wstrzymanie. Wstrzymanie spowoduje podzielenie danych podczas uczenia i testowania zestawu przed oceną zestawu testowego pod kątem wydajności modelu. Jeśli jednak spojrzysz na n-krotną walidację krzyżową, zobaczysz, że dane zostaną losowo podzielone na podzbiory, w których instancje k-1 będą używane do uczenia modelu, podczas gdy instancje k będą można wykorzystać do testowania zdolności predykcyjnej używanego modelu szkoleniowego. Oprócz tego metoda wstrzymania i walidacji krzyżowej będzie wykorzystywać próbki w przypadkach, gdy zastąpienie pochodzi ze zbioru danych i w jaki sposób będzie można je wykorzystać do oceny dokładności modelu. Co więcej, badacz stwierdza ogólną dokładność; zostanie on zgłoszony pod kątem specyficzności i wrażliwości, np. współczynnika prawdziwie ujemnego i współczynnika prawdziwie dodatniego – co oznacza, że współczynniki prawdziwie ujemne i prawdziwie dodatnie będą czasami wykazywane współczynniki fałszywie dodatnie lub fałszywie ujemne. Jednak to właśnie te stawki nie pokażą licznika i mianownika równania. Twoja całkowita charakterystyka operacyjna będzie skuteczną metodą, która pokaże możliwości diagnostyczne modelu. Całkowita charakterystyka pracy ujawni także liczniki i mianowniki wspomniane wcześniej w stawkach, co będzie oznaczać, że całkowita charakterystyka pracy pokaże więcej informacji, niż byłeś w stanie wykorzystać z charakterystyką pracy odbiornika, która będzie spadać pod obszarem pod krzywą. Ze względu na swoją specyfikę uczenie maszynowe często rodzi wiele pytań etycznych. Systemy przeszkolone do pracy z gromadzonymi danymi będą stronnicze w zależności od eksponatów, na których te uprzedzenia zostaną wykorzystane, co doprowadzi do digitalizacji uprzedzeń kulturowych. Dlatego odpowiedzialność wynikająca z gromadzenia danych będzie dużą częścią uczenia maszynowego. Ze względu na język, którego używasz w przypadku uczenia maszynowego, będziesz używać maszyn szkolonych w sposób uprzedzony.