In der Statistik ist es oft notwendig die Dichte, Quantile oder Wahrscheinlichkeiten
verschiedener Quantile einer bestimmten Verteilung zu bestimmen, etwa im
Rahmen von Signifikanztest im Rahmen linearer Modelle. R bietet hierfür
konsistente Befehlssequenzen, welche mit den Buchstaben d
, p
, q
und r
,
beginnen, gefolgt vom Namen der jeweiligen Verteilungsfunktion (z.b.
?dnorm
für die Dichte der Normalverteilung). Die einzelnen Buchstaben, die dem
Namen der Verteilungsfunktion vorhergehen haben folgende Bedeutung:
d
: density (oder Dichte): Wird verwendet um die Dichte einer Verteilung zu einem vorgegebenen Quantil zu bestimmenp
: probability (Wahrscheinlichkeit): Berechnet die Wahrscheinlichkeit (per default)
links von einem vorgegebenen Quantilq
: quantile (Quantil): Gibt zu einer vorgegebenen Wahrscheinlichkeit das passende Quantil, links von welchem die Fläche unter der Dichtefunktion der Verteilung der
vorgegebenen Wahrscheinlichkeit entsprichtr
: random (Zufallszahl): Zieht Zufallszahlen aus der entsprechenden Verteilung. Diese Bezeichnungen bleiben für alle in R implementierten Verteilungsfunktionen gleich. Beispiele für häufig verwendete Verteilungen:
t
: t-Verteilungf
: F-Verteilungchisq
: \(\chi^2\)-Verteilungnorm
: NormalverteilungWir ziehen Zufallszahlen aus der (Standard-)Normalverteilung, betrachten die Dichte dieser Zufallszahlen unf vergleichen Sie mit der theoretischen Dichte der SNV
## zufallszahlen
set.seed(134)
x <- rnorm(1000, mean = 0, sd = 1)
## empirische Dichte
plot(density(x))
## theorethische Dichte
lines(sort(x), y = dnorm(sort(x)), col = 2 )
## empirisches 0.025 , 0.5, und 0.975 quantil
(q.emp <- quantile(x, probs = c(0.025, 0.5, 0.975)))
## 2.5% 50% 97.5%
## -1.94509582 -0.03083425 1.88808010
## theoretische quantile
(q.theo <- qnorm(p = c(0.025, 0.5, 0.975)))
## [1] -1.959964 0.000000 1.959964
abline(v = q.emp, lty = 2, col = 3)
abline(v = q.theo, lty = 3, col = 2)
## Fläche links der entsprechenden empirischen Quantile
sapply(q.emp, function(z) sum(sort(x) < z))/length(x)
## 2.5% 50% 97.5%
## 0.025 0.500 0.975
## theoretische Wskt für Werte < q.emp
pnorm(q.emp)
## 2.5% 50% 97.5%
## 0.02588172 0.48770086 0.97049240