Verteilungsfunktionen in R

In der Statistik ist es oft notwendig die Dichte, Quantile oder Wahrscheinlichkeiten verschiedener Quantile einer bestimmten Verteilung zu bestimmen, etwa im Rahmen von Signifikanztest im Rahmen linearer Modelle. R bietet hierfür konsistente Befehlssequenzen, welche mit den Buchstaben d, p, q und r, beginnen, gefolgt vom Namen der jeweiligen Verteilungsfunktion (z.b. ?dnorm für die Dichte der Normalverteilung). Die einzelnen Buchstaben, die dem Namen der Verteilungsfunktion vorhergehen haben folgende Bedeutung:

d: density (oder Dichte): Wird verwendet um die Dichte einer Verteilung zu einem vorgegebenen Quantil zu bestimmen
p: probability (Wahrscheinlichkeit): Berechnet die Wahrscheinlichkeit (per default) links von einem vorgegebenen Quantil
q: quantile (Quantil): Gibt zu einer vorgegebenen Wahrscheinlichkeit das passende Quantil, links von welchem die Fläche unter der Dichtefunktion der Verteilung der vorgegebenen Wahrscheinlichkeit entspricht
r: random (Zufallszahl): Zieht Zufallszahlen aus der entsprechenden Verteilung.

Diese Bezeichnungen bleiben für alle in R implementierten Verteilungsfunktionen gleich. Beispiele für häufig verwendete Verteilungen:

t: t-Verteilung
f: F-Verteilung
chisq: \(\chi^2\)-Verteilung
norm: Normalverteilung

Anwendungsbeispiele:

Normalverteilung:

Wir ziehen Zufallszahlen aus der (Standard-)Normalverteilung, betrachten die Dichte dieser Zufallszahlen unf vergleichen Sie mit der theoretischen Dichte der SNV

## zufallszahlen
set.seed(134)
x <- rnorm(1000, mean = 0, sd = 1)
## empirische Dichte
plot(density(x))
## theorethische Dichte
lines(sort(x), y = dnorm(sort(x)), col = 2 )
## empirisches 0.025 , 0.5, und 0.975 quantil 
(q.emp <- quantile(x, probs = c(0.025, 0.5, 0.975)))

##        2.5%         50%       97.5% 
## -1.94509582 -0.03083425  1.88808010

## theoretische quantile
(q.theo <-  qnorm(p = c(0.025, 0.5, 0.975)))

## [1] -1.959964  0.000000  1.959964

abline(v = q.emp, lty = 2, col = 3)
abline(v = q.theo, lty = 3, col = 2)

plot of chunk NV-Verteilung

## Fläche links der entsprechenden empirischen Quantile
sapply(q.emp, function(z) sum(sort(x) < z))/length(x)

##  2.5%   50% 97.5% 
## 0.025 0.500 0.975

## theoretische Wskt für Werte < q.emp 
pnorm(q.emp)

##       2.5%        50%      97.5% 
## 0.02588172 0.48770086 0.97049240