Zrozumienie interakcji z korelacjami

Korelacja jest miarą liniowej zależności między dwiema zmiennymi. Jego wartość waha się od -1, oznaczającego doskonałą relację odwrotną, do 1, reprezentującego doskonały związek bezpośredni. Podobnie jak utworzyliśmy macierz wykresów punktowych, teraz utworzymy macierz korelacji, a wynikowy wykres pokazano poniżej. Duże koła oznaczają wysoką korelację bezwzględną. Niebieskie kółka oznaczają korelację dodatnią, a kółka czerwone korelację ujemną. Aby utworzyć ten wykres, użyjemy funkcji corrplot() z pakietu corrplot i przekażemy jej dane korelacji obliczone przez funkcję cor() w R, i opcjonalnie niektóre parametry etykiet tekstowych (tl), takie jak kolor (color) i rozmiar (cex).

Spójrzmy teraz na następujący kod:

library(corrplot)

corrplot(corr = cor(data_numerical(, tl.col = „black”, tl.cex = 0.6)

Jeśli spojrzymy na relację między zmienną Proportion a innymi zmiennymi, zmienne w dużych niebieskich kółkach są z nią dodatnio skorelowane, co oznacza, że ​​im bardziej ta zmienna rośnie, tym większe jest prawdopodobieństwo, że zmienna Proportion również wzrosnie. Aby zobaczyć przykłady tego typu, spójrz na relacje między AdultMeanAge i NoQuals z Proportion. Jeśli wśród Proportion i innych zmiennych znajdziemy duże czerwone kółka, oznacza to, że tym bardziej zmienna rośnie, tym bardziej prawdopodobne jest, że Proportion spadnie. Aby zobaczyć przykłady tego typu, spójrz na relacje między Age_25to29, Age_30to44 i L4Quals+plus z Proportion:

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *