(VI) Pakiet stats – "Bądź człowiekiem … A.I. !"

Pakiet stats zawiera elementy, takie jak podstawowe statystyki opisowe, rozkłady prawdopodobieństwa, testy, funkcje dopasowywania modeli, funkcje grupowania, niektóre funkcje kreślenia i inne funkcje używane do wyprowadzania wyników. Dokumentacja stats ma sześć stron (biblioteka (pomoc = statystyki)). Lista linków do stron pomocy ze stats ma 18 stron (pomoc (pakiet = statystyki)). My omówimy podstawowe statystyki opisowe, testy, grupowanie i inne funkcje dla danych wielowymiarowych oraz funkcje modelowania, ale z niewielkimi szczegółami.

Podstawowe statystyki opisowe

Niektóre z podstawowych funkcji statystycznych w statystykach pakietów obejmują:

weighted.mean (), która znajduje średnią ważoną obiektu

sd (), który znajduje odchylenie standardowe obiektu

va (), który znajduje wariancję wektora lub kowariancję macierz macierzy lub ramki danych

cov(), który znajduje macierz kowariancji macierzy lub danych ramka-bardziej elastyczny niż var()

cov.wt(), który znajduje ważoną kowariancję lub korelację macierz macierzy lub ramki danych

cor(), który znajduje korelację między wektorami lub w macierzach i ramkach danych

mediana(), która znajduje medianę elementów obiektu

mad(), który znajduje medianę absolutnego odchylenia elementów obiektu

IQR(), który znajduje przedział międzykwartylowy elementów obiekt

quantile(), który znajduje określone kwantyle elementów w obiekcie

fivenum(), która znajduje pięciocyfrowe podsumowanie Tukeya dotyczące elementów obiektu

ave(), która używa funkcji do działania na różnych wierszach obiektu

cancor(), która znajduje korelację kanoniczną między dwiema macierzami

dist(), który znajduje typ średniej różnicy między wierszami macierzy, na podstawie typu odległości i mocy użytej do znalezienia średniej

mahalanobis(), który znajduje odległość Mahalanobisa między wierszami macierzy

ecdf(), który znajduje empiryczną skumulowaną funkcję dystrybucji elementów w obiekcie – metoda kwantyli istnieje dla funkcji

r2dtable(), który tworzy losową dwukierunkową tabelę na podstawie wartości krańcowych – używając algorytmu Patefielda

simulate(), który symuluje obserwacje z modelu, który został dopasowany

TukeyHSD(), który znajduje przedziały ufności dla współczynników modelu uwzględniającego, że testowana jest więcej niż jedna hipoteza – do analizy modeli wariancji

xtabs(), który tworzy tabelę awaryjną na podstawie wzoru

smooth(), który tworzy płynniejszą wersję zaszumionego zestawu danych przy użyciu płynnych median płynnych Tukeya – zwykle używanych w szeregach czasowych

Funkcja w R: Opis

weighted.mean (x, w, …, na.rm = FALSE): Znajduje średnią ważoną z x, gdzie x jest przekształcane do wektora.

sd (x, na.rm = FALSE): Znajduje odchylenie standardowe x, gdzie x jest przekształcane w wektor; dzieli przez pierwiastek kwadratowy z (n-1).

var (x, y = NULL, na.rm = FALSE, use): Znajduje wariancję x, jeśli x jest wektorem lub kowariancją x i y lub macierzą kowariancji x, jeśli x jest macierzą lub ramką danych; dzieli przez (n-1)

cov (x, y = NULL, use = “everything”, metoda = c (“pearson”, “kendall”, “spearman”)): Znajduje kowariancję między x i y, jeśli podano y, lub macierz kowariancji x, jeśli x jest macierzą lub ramką danych; dostępnych jest więcej opcji niż w przypadku var ()

cov.wt (x, wt = rep (1 / nrow (x), nrow (x)), cor = FALSE, center = TRUE, method = c (“nieobciążone”, “ML”)): Znajduje ważoną macierz kowariancji lub ważona macierz korelacji x, gdzie x jest macierzą lub ramką danych

cor (x, y = NULL, use = “everything”, metoda = c (“pearson”, “kendall”, “spearman”)): Znajduje korelację między x i y, jeśli podano y, lub w obrębie x, jeśli tylko x jest dostarczane, gdzie x jest wektorem, macierzą lub ramką danych

mediana (x, na.rm = FAŁSZ): Znajduje medianę elementów x

mad (x, center = mediana (x), constant = 1,4826, na.rm = FALSE, low = FALSE, high = FALSE): Znajduje medianę bezwzględnego odchylenia x

IQR (x, na.rm = FALSE, type = 7): Znajduje przedział międzykwartylowy x

quantile (x, probs = seq (0,1, .25), na.rm = FALSE, names = TRUE, type = 7, …): Znajduje kwantyle x dla wartości probs

fivenum (x, na.rm = FALSE): Znajduje pięciocyfrowe podsumowanie Tukeya dla x ave (x, …, FUN = mean): Funkcja w FUN działa na grupach elementów x, gdzie zmienne grupujące są w argumencie. . .

cancor (x, y, xcenter = TRUE, ycenter = TRUE): Znajduje korelację kanoniczną między macierzami x i y

dist (x, metoda = “euklidesowa”, diag = FALSE, upper = FALSE, p = 2): Znajduje odległość między wierszami macierzy, gdzie typ odległości jest określony metodą

mahalanobis (x, center, cov, inverted = FALSE): Znajduje odległość Mahalanobisa między wierszami macierzy

ecdf (x): Znajduje empiryczną dystrybucyjną funkcję x

r2dtable (n, r, c): Tworzy losową tabelę na podstawie krańcowych sum dla wierszy i kolumn

simulate (x, nsim = 1, seed = NULL, …): Symuluje obserwacje z modelu podanego w x; x to model

TukeyHSD (x, które, kolejność = FAŁSZ, poziom konf. = 0,95, …): szczerze mówiąc istotne różnice Tukeya w analizie modeli wariancji

xtabs (formula = ~., data = parent.frame (), subset, sparse = FALSE, na.action, exclude = c (NA, NaN), drop.unused. levels = FALSE): Tworzy tabelę kontyngencji na podstawie formuła, gdzie zmienne po prawej stronie formuły służą do grupowania obiektu po lewej stronie

smooth (x, kind = c (“3RS3R”, “3RSS”, “3RSR”, “3R”, “3S”, ” 3 “,” S “), dwukrotnieit = FALSE, endrule =” Tukey “, do.ends = FALSE): Wygładza wektor lub serię czasową przy użyciu wygładzania ruchomej mediany Tukeya

Niektóre funkcje, które wykonują testy

W statystykach jest wiele funkcji, które wykonują testy hipotez. Niektóre funkcje obejmują:

bartlett.test() dla jednorodności wariancji

binomial.test() w celu uzyskania dokładnych testów przy użyciu rozkładu dwumianowego

Box.test() dla testów Box-Pierce i Ljug-Box – używanych w szeregach czasowych do testowania niezależności

chisq.test() do testowania danych licznikowych za pomocą testu Pearsona

cor.test() dla korelacji w sparowanych próbkach

fisher.test() dla tabel kontyngencji przy użyciu dokładnego testu Fishera fligner.test () dla testu Flignera-Killeena na jednorodność wariancji

friedman.test () dla testu sumy rang Friedmana

kruskal.test() dla testu sumy rang Kruskala-Wallisa

mantelhaen.test() dla testu Cochrana-Mantela-Haenszela chi kwadrat dla danych zliczeniowych

mauchly.test() do testu kulistości opracowanego przez Mauchly

mcnemar.test() dla testu chi-kwadrat dla danych zliczania opracowanego przez McNemara

mood.test() dla dwóch przykładowych testów skali opracowanych przez Mood

oneway.test() do testowania równych środków, jeśli układ jest jednokierunkowy

pairwise.prop.test() do porównywania proporcji pairwise pairwise.t.test () do porównywania testów t parami

pairwise.wilcox.test () do porównywania parami testów sumy rang Wilcoxa

poisson.test() do dokładnego testu wykorzystującego rozkład Poissona

power.anova.test() w celu znalezienia potęg dla zrównoważonej jednokierunkowej analizy lub wariancji

power.prop.test(), aby znaleźć potęgę do porównania dwóch proporcji

power.t.test() dla potęg w jednym i dwóch próbnych testach t

PP.test() dla testu Phillops-Perron do testowania pierwiastków jednostkowych w danych szeregów czasowych

prop.test() do testowania proporcji

prop.trend.test () do testowania trendu w proporcjach

quade.test() dla testu quade

shapiro.test() dla testu normalności Shapiro-Wilka

t.test ) do wykonania testu t

var.test() dla testu F w celu porównania dwóch wariancji

wilcox.test() dla testów sumy rang Wilcoxona i testów znaków

Test

bartlett.test(x, g, …)

biniom.test(x, n, p=0.5, alternative=c(“two-sided”, “less”, “greater”), conf.level=0.95)

Box.test(x, lag=1, type=c(“Box-Pierce”, “Ljung-Box”), fitdf=0)

chisq.test(x, y=NULL, correct=TRUE, p=rep(1/length(x), length(x)), rescale.p=FALSE,

B=2000)

cor.test(x, y, alternative=c(“two.sided”, “less”, “greater”), method=c(“pearson”, “kendall”,

“spearman”), exact=NULL, conf.level=0.95, continuity=FALSE, . . . )

fisher.test(x, y=NULL, workspace=200000, hybrid=FALSE, control=list(), or=1,

alternative=“two.sided”, conf.int=TRUE, conf.level=0.95, simulate.p.value=FALSE,

B=2000)

fligner.test(x, g, . . . )

friedman.test(y, groups, blocks, . . . )

kruskal(x, g, . . . )

ks.test(x, y, . . . , alternative=c(“two-sided”, “less”, “greater”), exact=NULL)

mantelhaen.test(x, y=NULL, z=NULL, alternative=c(“two.sided”, “less”, “greater”),

correct=T, exact=F, conf.level=0.95)

mauchly.test(object, . . . )

mcnemar.test(x, y=NULL, correct=TRUE)

mood.test(x, y, alternative=c(“two.sided”, “less”, “greater”), . . . )

oneway.test(formula, data, subset, na.action, var.equal=FALSE)

pairwise.prop.test(x, n, p.adjust.method=p.adjust.methods, . . . )

pairwise.t.test(x, g, p.adjust.method=p.adjust.methods, pool.sd=!paired, paired=FALSE,

alternative=c(“two.sided”, “less”, “greater”), . . . )

pairwise.wilcox.test(x, g, p.adjust.method=p.adjust.methods, paired=FALSE, . . . )

poisson.test(x, T=1, r=1, alternative=c(“two-sided”, “less”, “greater”), conf.level=0.95)

power.anova.test(groups=NULL, n=NULL, between.var=NULL, within.var=NULL, sig.

level=0.05, power=NULL)

power.prop.test(n=NULL, p1=NULL, p2=NULL, sig.level=0.05, power=NULL,

alternative=c(“two-sided”, “one.sided”), strict=FALSE)

power.t.test(n=NULL, delta=NULL, sd=1, sig.level=0.05, type=c(“two.sample”,

“one.sample”, “paired”), alternative=c(“two.sided”, “one.sided”), strict=FALSE)

PP.test(x, lshort=TRUE)

prop.test(x, n, p=NULL, alternative=c(“two-sided”, “less”, “greater”), conf.level=0.95,

correct=TRUE)

prop.tend.test(x, n, score=seq_along(x))

quade.test(y, . . . )

shapiro.test(x)

t.test(x, y=NULL, alternative=c(“two-sided”, “less”, “greater”), mu=0, paired=FALSE, var.

equal=FALSE, conf.level=0.95, . . . )

var.test(x, y, ratio=1, alternative=c(“two-sided”, “less”, “greater”), conf.level=0.95, . . . )

wilcox.test(x, y=NULL, alternative=c(“two-sided”, “less”, “greater”), mu=0,

paired=FALSE, exact=NULL, correct=TRUE, conf.int=FALSE, conf.level=0.95, . . . )

Post Views: 317

Dodaj komentarz Anuluj pisanie odpowiedzi