Verteilungsfunktionen in R

In der Statistik ist es oft notwendig die Dichte, Quantile oder Wahrscheinlichkeiten verschiedener Quantile einer bestimmten Verteilung zu bestimmen, etwa im Rahmen von Signifikanztest im Rahmen linearer Modelle. R bietet hierfür konsistente Befehlssequenzen, welche mit den Buchstaben d, p, q und r, beginnen, gefolgt vom Namen der jeweiligen Verteilungsfunktion (z.b. ?dnorm für die Dichte der Normalverteilung). Die einzelnen Buchstaben, die dem Namen der Verteilungsfunktion vorhergehen haben folgende Bedeutung:

Diese Bezeichnungen bleiben für alle in R implementierten Verteilungsfunktionen gleich. Beispiele für häufig verwendete Verteilungen:

Anwendungsbeispiele:

Normalverteilung:

Wir ziehen Zufallszahlen aus der (Standard-)Normalverteilung, betrachten die Dichte dieser Zufallszahlen unf vergleichen Sie mit der theoretischen Dichte der SNV

## zufallszahlen
set.seed(134)
x <- rnorm(1000, mean = 0, sd = 1)
## empirische Dichte
plot(density(x))
## theorethische Dichte
lines(sort(x), y = dnorm(sort(x)), col = 2 )
## empirisches 0.025 , 0.5, und 0.975 quantil 
(q.emp <- quantile(x, probs = c(0.025, 0.5, 0.975)))
##        2.5%         50%       97.5% 
## -1.94509582 -0.03083425  1.88808010
## theoretische quantile
(q.theo <-  qnorm(p = c(0.025, 0.5, 0.975)))
## [1] -1.959964  0.000000  1.959964
abline(v = q.emp, lty = 2, col = 3)
abline(v = q.theo, lty = 3, col = 2)

plot of chunk NV-Verteilung

## Fläche links der entsprechenden empirischen Quantile
sapply(q.emp, function(z) sum(sort(x) < z))/length(x)
##  2.5%   50% 97.5% 
## 0.025 0.500 0.975
## theoretische Wskt für Werte < q.emp 
pnorm(q.emp)
##       2.5%        50%      97.5% 
## 0.02588172 0.48770086 0.97049240