R : Podstawy uczenia maszynowego

Jak powiedzieliśmy na wstępie, uważamy, że najlepszym sposobem na naukę nowych umiejętności technicznych jest rozpoczęcie od problemu, który chcesz rozwiązać lub pytania, na które chcesz odpowiedzieć. Podekscytowanie wizją swojej pracy na wyższym poziomie sprawia, że ​​uczenie się na podstawie studiów przypadków jest skuteczne. W tym przeglądzie podstawowych pojęć w języku R nie zajmiemy się problemem uczenia maszynowego, ale napotkamy kilka problemów związanych z pracą z danymi i zarządzaniem nimi w języku R. Jak zobaczymy w studiach przypadków, dość często spędzimy większość czasu na sformatowaniu i uporządkowaniu danych w sposób odpowiadający analizie. Zwykle bardzo mało czasu, jeśli chodzi o kodowanie, spędza się na analizie. W tym przypadku odpowiemy na pytanie o wartości wyłącznie rozrywkowej. Niedawno serwis danych Infochimps.com opublikował zestaw danych z ponad 60 000 udokumentowanych raportów o niezidentyfikowanych obiektach latających (UFO). Dane obejmują setki lat i zawierają raporty z całego świata. Chociaż ma to charakter międzynarodowy, większość obserwacji w danych pochodzi ze Stanów Zjednoczonych. Przy czasie i wymiarach przestrzennych danych możemy zadać następujące pytania: czy istnieją obserwacje sezonowe w obserwacjach UFO; a jakie są ewentualne różnice między obserwacjami UFO w różnych stanach USA? Jest to świetny zestaw danych do rozpoczęcia eksploracji, ponieważ jest bogaty, dobrze zorganizowany i przyjemny w pracy. Przydaje się również w tym ćwiczeniu, ponieważ jest to duży plik tekstowy, który zazwyczaj jest typem danych, z którymi będziemy się zajmować  W takich plikach tekstowych często występują niechlujne części i będziemy używać funkcji podstawowych w R i niektórych bibliotekach zewnętrznych do czyszczenia i organizowania surowych danych. Ta sekcja przeprowadzi Cię krok po kroku przez całą prostą analizę, która próbuje odpowiedzieć na pytania, które zadaliśmy wcześniej.  Zaczynamy od załadowania danych i wymaganych bibliotek lub analizy.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *