Sprawdzanie liniowości za pomocą wykresów punktowych

Podstawowym sposobem sprawdzenia założenia o liniowości jest wykonanie wykresu rozrzutu ze zmienną zależną na osi y i zmienną niezależną na osi x. Jeśli relacja wydaje się być liniowa, założenie jest sprawdzane. W każdym interesującym problemie niezwykle trudno jest znaleźć wykres punktowy, który pokazuje bardzo wyraźną zależność liniową, a jeśli tak się stanie, powinniśmy być trochę podejrzliwi i ostrożni z danymi. Aby uniknąć ponownego wynalezienia koła, użyjemy funkcji plot_scatterlot , którą stworzyliśmy wcześniej:

plot_scatterplot(

data = data,

var_x = „age_18to44”,

var_y = „Proportion”

var_olor = FALSE

regression = TRUE

)

plot_scatterplot (

data = data,

var_x = „Students”,

var_y = „Proportion”,

var_color= FALSE

regression = TRUE

)

Jak widać, wykres punktowy po lewej stronie pokazuje wyraźną zależność liniową, wraz ze wzrostem odsetka osób między 18 a 44 rokiem życia (age_18to44) odsetek osób na korzyść opuszczających UE (Proportion) spada. Po prawej stronie widzimy, że relacja wśród odsetka uczniów na oddziale (Students) i Proportion jest wyraźnie liniowy w obszarze początkowym (gdzie Students mieści się w przedziale od 0 do 20), potem też relacja wydaje się być liniowa, ale jest zanieczyszczona obserwacjami z bardzo wysokim odsetkiem studentów. Jednak nadal możemy założyć liniową zależność między Student i Proportion. Kiedy robimy wielokrotną regresję liniową, tak jak tutaj robimy, założenie powinno zostać sprawdzone dla pozostałych zmiennych, które pomijamy tutaj, aby zachować miejsce, ale zachęcamy do tego. Należy pamiętać, że we wszystkich z nich bardzo trudno jest znaleźć zależność liniową, a to założenie jest głównie wskaźnikiem mocy predykcyjnej zmiennej w regresji. Dopóki relacja wydaje się być nieco liniowa, wszyscy powinniśmy być ustawione.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *