Pakiet stats zawiera elementy, takie jak podstawowe statystyki opisowe, rozkłady prawdopodobieństwa, testy, funkcje dopasowywania modeli, funkcje grupowania, niektóre funkcje kreślenia i inne funkcje używane do wyprowadzania wyników. Dokumentacja stats ma sześć stron (biblioteka (pomoc = statystyki)). Lista linków do stron pomocy ze stats ma 18 stron (pomoc (pakiet = statystyki)). My omówimy podstawowe statystyki opisowe, testy, grupowanie i inne funkcje dla danych wielowymiarowych oraz funkcje modelowania, ale z niewielkimi szczegółami.
Podstawowe statystyki opisowe
Niektóre z podstawowych funkcji statystycznych w statystykach pakietów obejmują:
weighted.mean (), która znajduje średnią ważoną obiektu
sd (), który znajduje odchylenie standardowe obiektu
va (), który znajduje wariancję wektora lub kowariancję macierz macierzy lub ramki danych
cov(), który znajduje macierz kowariancji macierzy lub danych ramka-bardziej elastyczny niż var()
cov.wt(), który znajduje ważoną kowariancję lub korelację macierz macierzy lub ramki danych
cor(), który znajduje korelację między wektorami lub w macierzach i ramkach danych
mediana(), która znajduje medianę elementów obiektu
mad(), który znajduje medianę absolutnego odchylenia elementów obiektu
IQR(), który znajduje przedział międzykwartylowy elementów obiekt
quantile(), który znajduje określone kwantyle elementów w obiekcie
fivenum(), która znajduje pięciocyfrowe podsumowanie Tukeya dotyczące elementów obiektu
ave(), która używa funkcji do działania na różnych wierszach obiektu
cancor(), która znajduje korelację kanoniczną między dwiema macierzami
dist(), który znajduje typ średniej różnicy między wierszami macierzy, na podstawie typu odległości i mocy użytej do znalezienia średniej
mahalanobis(), który znajduje odległość Mahalanobisa między wierszami macierzy
ecdf(), który znajduje empiryczną skumulowaną funkcję dystrybucji elementów w obiekcie – metoda kwantyli istnieje dla funkcji
r2dtable(), który tworzy losową dwukierunkową tabelę na podstawie wartości krańcowych – używając algorytmu Patefielda
simulate(), który symuluje obserwacje z modelu, który został dopasowany
TukeyHSD(), który znajduje przedziały ufności dla współczynników modelu uwzględniającego, że testowana jest więcej niż jedna hipoteza – do analizy modeli wariancji
xtabs(), który tworzy tabelę awaryjną na podstawie wzoru
smooth(), który tworzy płynniejszą wersję zaszumionego zestawu danych przy użyciu płynnych median płynnych Tukeya – zwykle używanych w szeregach czasowych
Funkcja w R: Opis
weighted.mean (x, w, …, na.rm = FALSE): Znajduje średnią ważoną z x, gdzie x jest przekształcane do wektora.
sd (x, na.rm = FALSE): Znajduje odchylenie standardowe x, gdzie x jest przekształcane w wektor; dzieli przez pierwiastek kwadratowy z (n-1).
var (x, y = NULL, na.rm = FALSE, use): Znajduje wariancję x, jeśli x jest wektorem lub kowariancją x i y lub macierzą kowariancji x, jeśli x jest macierzą lub ramką danych; dzieli przez (n-1)
cov (x, y = NULL, use = “everything”, metoda = c (“pearson”, “kendall”, “spearman”)): Znajduje kowariancję między x i y, jeśli podano y, lub macierz kowariancji x, jeśli x jest macierzą lub ramką danych; dostępnych jest więcej opcji niż w przypadku var ()
cov.wt (x, wt = rep (1 / nrow (x), nrow (x)), cor = FALSE, center = TRUE, method = c (“nieobciążone”, “ML”)): Znajduje ważoną macierz kowariancji lub ważona macierz korelacji x, gdzie x jest macierzą lub ramką danych
cor (x, y = NULL, use = “everything”, metoda = c (“pearson”, “kendall”, “spearman”)): Znajduje korelację między x i y, jeśli podano y, lub w obrębie x, jeśli tylko x jest dostarczane, gdzie x jest wektorem, macierzą lub ramką danych
mediana (x, na.rm = FAŁSZ): Znajduje medianę elementów x
mad (x, center = mediana (x), constant = 1,4826, na.rm = FALSE, low = FALSE, high = FALSE): Znajduje medianę bezwzględnego odchylenia x
IQR (x, na.rm = FALSE, type = 7): Znajduje przedział międzykwartylowy x
quantile (x, probs = seq (0,1, .25), na.rm = FALSE, names = TRUE, type = 7, …): Znajduje kwantyle x dla wartości probs
fivenum (x, na.rm = FALSE): Znajduje pięciocyfrowe podsumowanie Tukeya dla x ave (x, …, FUN = mean): Funkcja w FUN działa na grupach elementów x, gdzie zmienne grupujące są w argumencie. . .
cancor (x, y, xcenter = TRUE, ycenter = TRUE): Znajduje korelację kanoniczną między macierzami x i y
dist (x, metoda = “euklidesowa”, diag = FALSE, upper = FALSE, p = 2): Znajduje odległość między wierszami macierzy, gdzie typ odległości jest określony metodą
mahalanobis (x, center, cov, inverted = FALSE): Znajduje odległość Mahalanobisa między wierszami macierzy
ecdf (x): Znajduje empiryczną dystrybucyjną funkcję x
r2dtable (n, r, c): Tworzy losową tabelę na podstawie krańcowych sum dla wierszy i kolumn
simulate (x, nsim = 1, seed = NULL, …): Symuluje obserwacje z modelu podanego w x; x to model
TukeyHSD (x, które, kolejność = FAŁSZ, poziom konf. = 0,95, …): szczerze mówiąc istotne różnice Tukeya w analizie modeli wariancji
xtabs (formula = ~., data = parent.frame (), subset, sparse = FALSE, na.action, exclude = c (NA, NaN), drop.unused. levels = FALSE): Tworzy tabelę kontyngencji na podstawie formuła, gdzie zmienne po prawej stronie formuły służą do grupowania obiektu po lewej stronie
smooth (x, kind = c (“3RS3R”, “3RSS”, “3RSR”, “3R”, “3S”, ” 3 “,” S “), dwukrotnieit = FALSE, endrule =” Tukey “, do.ends = FALSE): Wygładza wektor lub serię czasową przy użyciu wygładzania ruchomej mediany Tukeya
Niektóre funkcje, które wykonują testy
W statystykach jest wiele funkcji, które wykonują testy hipotez. Niektóre funkcje obejmują:
bartlett.test() dla jednorodności wariancji
binomial.test() w celu uzyskania dokładnych testów przy użyciu rozkładu dwumianowego
Box.test() dla testów Box-Pierce i Ljug-Box – używanych w szeregach czasowych do testowania niezależności
chisq.test() do testowania danych licznikowych za pomocą testu Pearsona
cor.test() dla korelacji w sparowanych próbkach
fisher.test() dla tabel kontyngencji przy użyciu dokładnego testu Fishera fligner.test () dla testu Flignera-Killeena na jednorodność wariancji
friedman.test () dla testu sumy rang Friedmana
kruskal.test() dla testu sumy rang Kruskala-Wallisa
mantelhaen.test() dla testu Cochrana-Mantela-Haenszela chi kwadrat dla danych zliczeniowych
mauchly.test() do testu kulistości opracowanego przez Mauchly
mcnemar.test() dla testu chi-kwadrat dla danych zliczania opracowanego przez McNemara
mood.test() dla dwóch przykładowych testów skali opracowanych przez Mood
oneway.test() do testowania równych środków, jeśli układ jest jednokierunkowy
pairwise.prop.test() do porównywania proporcji pairwise pairwise.t.test () do porównywania testów t parami
pairwise.wilcox.test () do porównywania parami testów sumy rang Wilcoxa
poisson.test() do dokładnego testu wykorzystującego rozkład Poissona
power.anova.test() w celu znalezienia potęg dla zrównoważonej jednokierunkowej analizy lub wariancji
power.prop.test(), aby znaleźć potęgę do porównania dwóch proporcji
power.t.test() dla potęg w jednym i dwóch próbnych testach t
PP.test() dla testu Phillops-Perron do testowania pierwiastków jednostkowych w danych szeregów czasowych
prop.test() do testowania proporcji
prop.trend.test () do testowania trendu w proporcjach
quade.test() dla testu quade
shapiro.test() dla testu normalności Shapiro-Wilka
t.test ) do wykonania testu t
var.test() dla testu F w celu porównania dwóch wariancji
wilcox.test() dla testów sumy rang Wilcoxona i testów znaków
Test
bartlett.test(x, g, …)
biniom.test(x, n, p=0.5, alternative=c(“two-sided”, “less”, “greater”), conf.level=0.95)
Box.test(x, lag=1, type=c(“Box-Pierce”, “Ljung-Box”), fitdf=0)
chisq.test(x, y=NULL, correct=TRUE, p=rep(1/length(x), length(x)), rescale.p=FALSE,
B=2000)
cor.test(x, y, alternative=c(“two.sided”, “less”, “greater”), method=c(“pearson”, “kendall”,
“spearman”), exact=NULL, conf.level=0.95, continuity=FALSE, . . . )
fisher.test(x, y=NULL, workspace=200000, hybrid=FALSE, control=list(), or=1,
alternative=“two.sided”, conf.int=TRUE, conf.level=0.95, simulate.p.value=FALSE,
B=2000)
fligner.test(x, g, . . . )
friedman.test(y, groups, blocks, . . . )
kruskal(x, g, . . . )
ks.test(x, y, . . . , alternative=c(“two-sided”, “less”, “greater”), exact=NULL)
mantelhaen.test(x, y=NULL, z=NULL, alternative=c(“two.sided”, “less”, “greater”),
correct=T, exact=F, conf.level=0.95)
mauchly.test(object, . . . )
mcnemar.test(x, y=NULL, correct=TRUE)
mood.test(x, y, alternative=c(“two.sided”, “less”, “greater”), . . . )
oneway.test(formula, data, subset, na.action, var.equal=FALSE)
pairwise.prop.test(x, n, p.adjust.method=p.adjust.methods, . . . )
pairwise.t.test(x, g, p.adjust.method=p.adjust.methods, pool.sd=!paired, paired=FALSE,
alternative=c(“two.sided”, “less”, “greater”), . . . )
pairwise.wilcox.test(x, g, p.adjust.method=p.adjust.methods, paired=FALSE, . . . )
poisson.test(x, T=1, r=1, alternative=c(“two-sided”, “less”, “greater”), conf.level=0.95)
power.anova.test(groups=NULL, n=NULL, between.var=NULL, within.var=NULL, sig.
level=0.05, power=NULL)
power.prop.test(n=NULL, p1=NULL, p2=NULL, sig.level=0.05, power=NULL,
alternative=c(“two-sided”, “one.sided”), strict=FALSE)
power.t.test(n=NULL, delta=NULL, sd=1, sig.level=0.05, type=c(“two.sample”,
“one.sample”, “paired”), alternative=c(“two.sided”, “one.sided”), strict=FALSE)
PP.test(x, lshort=TRUE)
prop.test(x, n, p=NULL, alternative=c(“two-sided”, “less”, “greater”), conf.level=0.95,
correct=TRUE)
prop.tend.test(x, n, score=seq_along(x))
quade.test(y, . . . )
shapiro.test(x)
t.test(x, y=NULL, alternative=c(“two-sided”, “less”, “greater”), mu=0, paired=FALSE, var.
equal=FALSE, conf.level=0.95, . . . )
var.test(x, y, ratio=1, alternative=c(“two-sided”, “less”, “greater”), conf.level=0.95, . . . )
wilcox.test(x, y=NULL, alternative=c(“two-sided”, “less”, “greater”), mu=0,
paired=FALSE, exact=NULL, correct=TRUE, conf.int=FALSE, conf.level=0.95, . . . )