# ------------------------------------------------------------------------------
# -------- Übung zur Vorlesung Kategoriale Daten -------------------------------
# -------- R Code / Blatt 5                      -------------------------------
# ------------------------------------------------------------------------------



################################################################################
#
# -------- Aufgabe 19 ----------------------------------------------------------
#
################################################################################

library(aod)
data(orob2)
?orob2
orob2
attach(orob2)
response <- cbind(y,n-y)


# a)

# Binomial-Modell nur mit unterschiedlicher Gattung
Bin1 <- glm(response ~ seed, family=binomial)
summary(Bin1)

# Binomial-Modell mit unterschiedlicher Gattung und Wurzel-Extrakten
Bin2 <- glm(response ~ seed + root, family=binomial)
summary(Bin2)

# Binomial-Modell mit unterschiedlicher Gattung  und Wurzel-Extrakten 
# plus Wechselwirkung
Bin3 <- glm(response ~ seed*root, family=binomial)
summary(Bin3)

# Vergleich der Modelle mittels AIC:
AIC(Bin1, Bin2, Bin3)

# Vergleich der Modelle mittels Devianz-Analyse
anova(Bin1,Bin2,Bin3)
1-pchisq(Bin1$dev - Bin2$dev, 1)
1-pchisq(Bin2$dev - Bin3$dev, 1)
1-pchisq(Bin1$dev - Bin3$dev, 2)

# => Modell Bin3


# b)

# Zu beachten:
# - In dem Argument formula von betabin() muss die Zielgröße die Struktur 
#   cbind(y,n-y) haben (d.h. selbst wenn response=cbind(y,n-y) gilt, darf man 
#   nicht response schreiben) 
# - \phi im Output ist das \delta aus der Übung/Vorlesung

# Beta-Binomial-Modell nur mit unterschiedlicher Gattung
BetaBin1 <- betabin(cbind(y,n-y) ~ seed, random=~1, data=orob2)
summary(BetaBin1)

# Beta-Binomial-Modell mit unterschiedlicher Gattung und Wurzel-Extrakten
BetaBin2 <- betabin(cbind(y,n-y) ~ seed + root, random=~1, data=orob2)
summary(BetaBin2)

# Beta-Binomial-Modell mit unterschiedlicher Gattung  und Wurzel-Extrakten 
# plus Wechselwirkung
BetaBin3 <- betabin(cbind(y,n-y) ~ seed * root, random=~1, data=orob2)
summary(BetaBin3)

# Vergleich der Modelle mittels AIC:
AIC(BetaBin1, BetaBin2, BetaBin3)

# Vergleich der Modelle mittels Devianz-Analyse
anova(BetaBin1,BetaBin2,BetaBin3)
1-pchisq(BetaBin1@dev - BetaBin2@dev, 1)
1-pchisq(BetaBin2@dev - BetaBin3@dev, 1)
1-pchisq(BetaBin1@dev - BetaBin3@dev, 2)

# => Modell BetaBin3


# c)

# Quasi-Binomial-Modell nur mit unterschiedlicher Gattung
QuasiBin1 <- glm(response ~ seed, family=quasibinomial)
summary(QuasiBin1)

# Quasi-Binomial-Modell mit unterschiedlicher Gattung und Wurzel-Extrakten
QuasiBin2 <- glm(response ~ seed + root, family=quasibinomial)
summary(QuasiBin2)

# Quasi-Binomial-Modell mit unterschiedlicher Gattung  und Wurzel-Extrakten 
# plus Wechselwirkung
QuasiBin3 <- glm(response ~ seed*root, family=quasibinomial)
summary(QuasiBin3)

# Bei Quasi-Binomial-Modelle keine AIC- und Devianz-Bestimmung möglich, da keine
# Verteilung spezifiziert wird (Achtung! glm() gibt bei Quasi-Modell die 
# Devianzen des gewöhnlichen Binomial-Modells aus!!!)


# d) 

#-----------------------------------
# Vergleich der Outputs
#-----------------------------------

# Schätzer für Koeffizienten im Quasi-Binomial-Modell und im Binomial-Modell
# sind dieselben, da \phi in der Schätzgleichung rausfliegt

# Standardfehler im Quasi-Binomial-Modell größer als im Binomial-Modell
# -> siehe Zusammenhang mit \phi

# Standardfehler im Beta-Binomial-Modell größer als im Binomial-Modell
# -> Beachte: Nur Overdispersion-Modellierung im Beta-Binomial-Modell möglich


#-----------------------------------
# Möglichkeiten des Modellvergleichs
#-----------------------------------

# Vergleich der Binomial- und der Beta-Binomial-Modelle mit AIC möglich
# => Modell BetaBin3

# Vergleich der Binomial- und der Beta-Binomial-Modelle mit Devianzen wegen 
# hierarchischer Struktur möglich: 
# Binomial-Modell = Beta-Binomial-Modell bei \delta=0 (und damit \phi=1) 
1-pchisq(Bin1$dev - BetaBin1@dev, 1)
1-pchisq(Bin2$dev - BetaBin2@dev, 1)
1-pchisq(Bin3$dev - BetaBin3@dev, 1)
# => Modell Bin3

# Ein Vergleich mit den Quasi-Binomialmodellen über AIC bzw. Devianz ist nicht 
# möglich, da Vtlg nicht bekannt. 

# Vergleich sämtlicher Modelle über Kreuzvalidierung:
# Kriterien z.B.
#  - Trefferquote
#  - Kullback-Leibler-Distanz