# Blatt 11, Aufgabe 1 # Daten einlesen load("miete.rda") attach(miete) names(miete) ######################### # Marginale Korrelationen ######################### c.nm.wfl <- cor(nm,wfl) c.wfl.rooms <- cor(wfl,rooms) c.nm.rooms <- cor(nm,rooms) # Marginale Korrelation zwischen nm und wfl sowie zwischen rooms und wfl # deutlich positiv, zwischen nm und rooms mittel positiv ######################## # Bedingte Korrelationen ######################## #Datensatz wird bzgl. der Faktorvariable rooms aufgesplittet (1 bis 6 Zimmer): #man erhaelt eine Liste dat<-split(as.data.frame(cbind(nm,wfl)),as.factor(rooms)) head(dat) # Korrelationen zwischen nm und wfl bedingt auf rooms lapply(dat,cor) # Je hoeher die Anzahl an Zimmern, desto geringer die Korrelation ######################## ## Partielle Korrelation ######################## # Regression von nm bzw. wfl auf rooms um Fehlerterme zu schaetzen errnm<-lm(nm~rooms)$residuals errwfl<-lm(wfl~rooms)$residuals cor(errnm,errwfl) ### entspricht: cov(errnm,errwfl) / (sd(errnm) * sd(errwfl)) ### ODER: (c.nm.wfl - c.wfl.rooms*c.nm.rooms)/(sqrt(1-c.wfl.rooms^2)*sqrt(1-c.nm.rooms^2)) # Nach herauspartialisieren des linearen Anteils von rooms # nimmt die Korrelation von wfl und nm (gegenueber der marginalen Korrelation) # ab (0.7 auf 0.55).