Teraz, gdy wiemy, jak wytrenować nasze modele i znaleźć najlepszy z możliwych, przedstawimy prognozy dla tych okręgów, dla których nie mamy danych głosowania, używając najlepszych modeli, które znaleźliśmy przy użyciu miary Vote. Aby to zrobić, po prostu wykonujemy następujący wiersz:
predictions <- predit(best_lm_fit_by_votes, data_incomplete)
predictions
#> 804 805 806 807 808 809 810 811 812 813
#> 0,6845 0,6238 0,5286 0,4092 0,5236 0,6727 0,6322 0,6723 0,6891 0,6004
#> 814815816817818819820821822823
#> 0,6426 0,5854 0,6966 0,6073 0,4869 0,5974 0,5611 0,4784 0,5534 0,6151
(Obcięte wyjście)
Spowoduje to wybranie najlepszego modelu, jaki znaleźliśmy wcześniej przy użyciu miary Vote, i wykorzystamy go do wygenerowania prognoz dla zmiennej Proprotion w data_incomplete dane, które zawierają te obserwacje, dla których nie mamy żadnych danych do głosowania. Są to najlepsze prognozy, jakie możemy dostarczyć dzięki temu, co zrobiliśmy do tej pory i możemy oczekiwać, że będą miały 91% dokładność, gdy zostaną użyte do kategoryzowania zmiennej Proprotion do zmiennej Vote.