Regresja: przewidywanie wyświetleń strony

Przedstawiamy regresję

W skrócie regresja jest bardzo prostym pojęciem: chcesz przewidzieć jeden zestaw liczb na podstawie innego zestawu liczb. Na przykład aktuariusze mogą chcieć przewidzieć, jak długo dana osoba przeżyje, biorąc pod uwagę swoje nawyki związane z paleniem, podczas gdy meteorolodzy mogą chcieć przewidzieć temperaturę na następny dzień, biorąc pod uwagę temperaturę z poprzedniego dnia. Zasadniczo będziemy wywoływać liczby, które otrzymałeś, i liczby, które chcesz przewidzieć. Czasem też można usłyszeć, że ludzie nazywają dane wejściowe mianem predyktorów lub funkcji. Tym, co odróżnia regresję od klasyfikacji, jest fakt, że dane wyjściowe to tak naprawdę liczby. W problemach z klasyfikacją, takich jak te, które opisaliśmy wcześniej, możesz użyć liczb jako fałszywego kodu dla kategorycznego rozróżnienia, tak że 0 oznacza ham, a 1 spam. Ale te liczby są tylko symbolami; nie wykorzystujemy „liczby” 0 lub 1, gdy używamy zmiennych zastępczych. W regresji istotnym faktem na temat wyników jest to, że tak naprawdę są liczbami: chcesz przewidzieć takie rzeczy, jak temperatura, która może wynosić 20 stopni lub 41 stopni. Ponieważ przewidujesz liczby, chcesz być w stanie wydać mocne oświadczenia na temat związku między danymi wejściowymi i wyjściowymi: możesz na przykład powiedzieć, że gdy liczba paczek papierosów osoby palącej dziennie podwaja się, ich przewidywana długość życia zostaje zmniejszona o połowę. Problem polega oczywiście na tym, że chęć precyzyjnego przewidywania numerycznego to nie to samo, co faktyczne przewidywanie. Aby dokonać prognoz ilościowych, musimy opracować zasadę, która może wykorzystać informacje, do których mamy dostęp. Różne algorytmy regresji opracowane przez statystyków w ciągu ostatnich 200 lat zapewniają różne sposoby prognozowania, przekształcając dane wejściowe w dane wyjściowe. W tym rozdziale omówimy model regresji woła roboczego, który nazywa się regresją liniową.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *