#Aufgabe 2 ########### #(i) # Datensatz einlesen aids<-read.table("aids.txt", header=TRUE) attach(aids) # Schaetze Modell mit Funktion glm(), alternativ waere auch lm() moeglich aids_lin<-glm(deaths~time, family=gaussian(), data=aids) # berechne gefittete Werte fit_lin<-fitted.values(aids_lin) #oder kuerzer: fit_lin<-fitted(aids_lin) plot(deaths, fit_lin, xlab="tatsaechliche Todesfaelle", ylab="geschaetzte Todesfaelle", main="Gauss-Modell") abline(0,1, col="red") #Interpretation: # insgesamt recht guter Fit # #Problem: # geschaetzte Todesfaelle sind teilweise negativ #(ii) #Es handelt sich um Zaehldaten; zu verwenden ist daher ein Poissonmodell aids_pois<-glm(deaths~time, family=poisson, data=aids) fit_pois<-fitted(aids_pois) plot(deaths, fit_pois, xlab="tatsaechliche Todesfaelle", ylab="geschaetzte Todesfaelle", main="Poisson-Modell") abline(0,1, col="red") # Vergleich der beiden Plots par(mfrow=c(1,2)) plot(deaths, fit_lin, xlab="tatsaechliche Todesfaelle", ylab="geschaetzte Todesfaelle", main="Gauss-Modell") abline(0,1, col="red") plot(deaths, fit_pois, xlab="tatsaechliche Todesfaelle", ylab="geschaetzte Todesfaelle", main="Poisson-Modell") abline(0,1, col="red") #Interpretation: # Keine negativen Schaetzungen beim Poisson-Modell # In beiden Faellen Trend(s) erkennbar # #Auffaelligkeiten: # Beim Poissonmodell sehr viele sehr kleine Schaetzwerte, # die kaum streuen, wenige grosse Schaetzwerte mit staerkerer Streuung #(iii) #Poissonmodell pois_pred1<-coefficients(aids_pois)[1]+coefficients(aids_pois)[2]*15 exp(pois_pred1) pois_pred2<-predict(aids_pois, newdata=data.frame("time"=15)) exp(pois_pred2) #Lineares Modell lin_pred1<-coefficients(aids_lin)[1]+coefficients(aids_lin)[2]*15 lin_pred1 lin_pred2<-predict(aids_lin, newdata=data.frame("time"=15)) lin_pred2 #Vergleich: # Poissonmodell sagt hoeheren Wert vorher.