#Aufgabe 2 ########## #install.packages("AER") library("AER") #Datensatz laden data("SwissLabor", package="AER") #(i) plot(SwissLabor$participation~SwissLabor$age) #der Anteil der berufstaetigen Frauen nimmt bis zu einem Alter von 45 Jahren #zu und sinkt anschliessend Swiss<-glm(participation~age, family=binomial(link="logit"), data=SwissLabor) summary(Swiss) #Die Kovariable age hat einen signifikanten Einfluss (p-Wert= 0.00657) #INTERPRETATION: # Erhoehung von x_alter um eine Einheit (x_alter +1): # exp(beta_alter*(x_alter+1)) = exp(beta_alter*x_alter)*exp(beta_alter) #mit jedem Jahrzehnt verringert sich die Chance auf Berufstaetigkeit um #den Faktor exp(-0.17689) = 0.8378719 exp(-0.17689) #(ii) #Logit-Modell Swiss_logit<-glm(participation~., family=binomial(), data=SwissLabor) #nat. Link muss nicht extra angegeben werden #Probit-Modell Swiss_probit<-glm(participation~., family=binomial(link = "probit"), data=SwissLabor) #cLogLog-Modell Swiss_loglog<-glm(participation~., family=binomial(link="cloglog"), data=SwissLabor) # Links ueber Hilfeseiten findbar : ?glm => "family" anklicken, "make.link" anklicken # => Liste moeglicher Links wird angezeigt summary(Swiss_logit) #am zweitbesten summary(Swiss_probit) summary(Swiss_loglog) #am besten #Vergleich der Modelle anhand des AIC list("Logit-AIC"=AIC(Swiss_logit), "Probit-AIC"=AIC(Swiss_probit), "LogLog-AIC"=AIC(Swiss_loglog)) #insgesamt nur geringe Differenzen #je kleiner das AIC umso besser #(iii) Swiss_quadr<-update(Swiss_logit, .~.+I(age^2)) summary(Swiss_quadr) AIC(Swiss_quadr) #Vergleich mit dem Logitmodell aus (ii) : # Verbesserung des Fits: # 1. quadriertes Alter hochsignifikant # 2. AIC verbessert sich DEUTLICH # # In Aufgabe (i) ist ersichtlich, dass das Alter keinen linearen Einfluss hat: plot(SwissLabor$participation~SwissLabor$age) # Durch Aufnahme des quadratischen Alters wird eine # flexiblere Modellierung moeglich. # Aenderung der Chance auf Berufstaetigkeit in Abhaengigkeit des Alters um Faktor: for(i in seq(2,6, by=0.5)) { cat(i*10, ":", exp(3.43+ 2*(-0.487*i) - 0.487), "\n")} # bis ca. 30 Jahren steigen die Berufsaussichten (da Faktor > 1), ab 35 Jahre # sinken die Berufsaussichten, da Faktor < 1. # => spiegelt den Effekt aus dem spine plot in (i) wieder