Głębokie uczenie zostało z powodzeniem zastosowane w wielu ważnych obszarach problemowych w sztucznej inteligencji.
Wizja
Zaczynamy od wizji komputerowej, która jest obszarem zastosowań, który prawdopodobnie wywarł największy wpływ na głębokie uczenie się i na odwrót. Chociaż głębokie sieci konwolucyjne były używane od lat 90. do zadań takich jak rozpoznawanie pisma ręcznego, a sieci neuronowe zaczęły przewyższać modele prawdopodobieństwa generatywnego do rozpoznawania mowy około 2010 r., był to sukces systemu głębokiego uczenia AlexNet w konkursie ImageNet 2012 które sprawiły, że głębokie uczenie się znalazło się w centrum uwagi. Konkurs ImageNet był nadzorowanym zadaniem edukacyjnym z 1 200 000 obrazów w 1000 różnych kategoriach, a systemy zostały ocenione na podstawie „top-5” – jak często właściwa kategoria pojawia się w pięciu najlepszych prognozach. AlexNet osiągnął poziom błędu 15,3%, podczas gdy kolejny najlepszy system miał ponad 25%. AlexNet miał pięć warstw splotowych przeplatanych warstwami z maksymalną pulą, a następnie trzy w pełni połączone warstwy. Wykorzystał funkcje aktywacji ReLU i wykorzystał procesory graficzne, aby przyspieszyć proces treningu 60 milionów ciężarków. Od 2012 roku, dzięki ulepszeniom w projektowaniu sieci, metodach szkoleniowych i zasobach obliczeniowych, wskaźnik błędów z pierwszej piątki został zredukowany do mniej niż 2% — znacznie poniżej wskaźnika błędów przeszkolonego człowieka (około 5%). CNN są stosowane w szerokim zakresie zadań związanych z widzeniem, od autonomicznych samochodów po sortowanie ogórków. Prowadzenie pojazdów, należy do najbardziej wymagających zadań związanych z widzeniem: nie algorytm musi jedynie wykrywać, lokalizować, śledzić i rozpoznawać gołębie, torby papierowe i pieszych, ale musi to robić w czasie rzeczywistym z niemal idealną dokładnością.