Topic outline

  • Aktuelles

    • 31.07.2017: Die Seminararbeiten sind bis spätestens 01.09.2017 (24 Uhr) in Papierform bei Pia Oberschmidt und digital (per Mail) bei Matthias Aßenmacher abzugeben.
    • 14.07.2017: Die Folien zu Vortrag 11 (inkl. Code & Handout) sind online.
    • 07.07.2017: Die Folien zu Vortrag 9 und 10 (Aktualisiert: 12.07.2017) sind online.
    • 23.06.2017: Die Folien zu Vortrag 7 und 8 sind online.
    • 19.06.2017: Die Folien zu den Vorträgen von Prof. Heumann (heute) und Prof. Küchenhoff (späterer Termin) sind online.
    • 17.06.2017: Die Folien für Vortrag 6 sind online (Aktualisiert: 20.06.2017).
    • 09.06.2017: Die Folien für Vortrag 4 sind online.
    • 30.05.2017: Die Literatur zu Thema 2 [Rubin (1976), Little & Rubin (2014) - Kapitel 1] soll sich in Eigenregie angeeignet werden. 
    • 27.05.2017: Die Folien für Vortrag 1 sind online.
    • 22.05.2017: Die Folien der Zwischenpräsentationen sind für alle eingeschriebenen Teilnehmer auf der Moodle-Seite verfügbar.
    • 25.04.2017: Die Zuordnung Thema - Bearbeitender - Betreuer ist nun online.
    • 12.04.2017: Die Moodle-Seite wurde erstellt.

    • Beschreibung

      Fehlende Werte und fehlerhafte Messungen sind bei praktischen Auswertungen ein sehr häufig auftretenden Problem. Meistens werden diese beiden Probleme getrennt betrachtet und es haben sich unterschiedliche Ansätze dabei entwickelt. Ziel des Seminars ist es, nach einer Übersicht beider Teilaspekte, gemeinsame Ansätze herauszuarbeiten. 

      Ein Schwerpunkt des Seminars liegt bei der Problematik der individuellen Expositionserhebung im Rahmen von größeren epidemiologischen Studien, an denen wir beteiligt sind. Die Erhebung der individuellen Exposition ist oft sehr teuer, technisch aufwändig oder bei retrospektiven Studien nicht mehr möglich; deswegen stehen in vielen Fällen messfehlerbehaftete Expositionsmessungen zur Verfügung, die auch fehlende Werte enthalten können. 

      So ist zum Beispiel für die Analyse des Zusammenhangs zwischen Erkrankungs- oder Todesfällen und der Strahlungsexposition bei Arbeitern im Uranerzabbau in der DDR zum Teil nur die geschätzte Exposition auf aggregierter Ebene vor (Jahr, Objekt, …) vorhanden. 

      Ein weiteres Beispiel ist die Messung der individuellen Feinstaubexposition: mobile Geräte messen ungenau und sind sehr teuer. Verwendet man stattdessen Messungen von Messstationen, spiegeln diese oft nur unzureichend die individuelle Exposition wider.

      Einen allgemeinen Überblick zum Thema Messfehler bietet das Buch von Carroll et al. und von Gustafson. Einen Überblick zum Thema fehlender Daten gibt das Buch von Little und Rubin. Blackwell et al. behandeln einen Ansatz zur Behandlung von fehlenden und fehlerbehafteten Daten.


      Die konkrete Themenvergabe und Literatur zu den einzelnen Themen erfolgt bei der Vorbesprechung.

      • Veranstaltungstermine und -ort

        Vorbesprechung
        Montag, 24.04.17 16 - 18 Uhr c.t. Seminarraum 144, Institut für Statistik, Ludwigstr. 33
        Vortragstermine
        Montag 16 - 18 Uhr c.t. Seminarraum 144, Institut für Statistik, Ludwigstr. 33

        Die genauen Daten der Vortragstermine werden noch festgelegt.

        • Vorträge

          Vorträge

          Folien
          Datum Thema Vortragender
          Kurzvorträge
          15.05.2017
          Kurze Inhaltsvorstellungalle
          Vortrag 1
          29.05.2017
          Messfehler in statistischen Analysen: Einführung und Auswirkungen 
          Neuber
          Vortrag 2
          29.05.2017
          Fehlende Werte in statistischen Analysen Einführung und Auswirkungen
          Pfaff
          Vortrag 3
          12.06.2017
          Einfache Verfahren zum Umgang mit fehlenden Werten und Messfehlern 
          Fountoulidis
          Vortrag 4
          12.06.2017
          Verfahren zum Umgang mit Messfehlern bei stetigen Variablen
          Berchtold
          Vortrag 5
          19.06.2017
          Verfahren zum Umgang mit fehlklassifizierten Einflussgrößen
          Shraim
          Vortrag 6
          19.06.2017
          Berücksichtigung von Messfehlern in einer Studie zu Strahlenexposition
          französischer Uran-Bergbauarbeiter
          Groh
          Vortrag 7
          26.06.2017
          Fortgeschrittene Verfahren zum Umgang mit fehlenden Werten (1)
          Menacher
          Vortrag 8
          26.06.2017
          Fortgeschrittene Verfahren zum Umgang mit fehlenden Werten (2)
          Pokatilo
          Vortrag 9
          10.07.2017
          Fallbeispiele zur Messfehlerkorrektur und zur Berücksichtigung fehlender
          Werte in der Praxis
          Petrova
          Vortrag 10
          10.07.2017
          Bayesianische Ansätze zur simultanen Berücksichtigung von Messfehlern
          und fehlenden Werten
          Semenenko
          Vortrag 11
          17.07.2017
          Multiple Overimputation
          Kaiser
          Kurz-Vorträge17.07.2017
          Alle Themen, abgesehen von Thema 11

          Die Zeitplanung ist vorläufig und könnte ggf. noch abweichen.

        • Literatur

          Literatur (vorläufig)

          Zu 1)
          • Carroll, R. J., Ruppert, D., Stefanski, L. A., & Crainiceanu, C. M. (2006). Measurement error in nonlinear models: a modern perspective. CRC press.
          • Gustafson, P. (2003). Measurement error and misclassification in statistics and epidemiology: impacts and Bayesian adjustments. CRC Press.
          • Buonaccorsi, J. P. (2010). Measurement error: models, methods, and applications. CRC Press.
          Zu 2) 
          Zu 3) 
          • Carroll, R. J., Ruppert, D., Stefanski, L. A., & Crainiceanu, C. M. (2006). Measurement error in nonlinear models: a modern perspective. CRC press.

          • Buonaccorsi, J. P. (2010). Measurement error: models, methods, and applications. CRC Press.

          • Andridge, Rebecca R., and Roderick JA Little. "A review of hot deck imputation for survey non‐response." International statistical review 78.1 (2010): 40-64.

          Zu 4) 
          • Carroll, R. J., Ruppert, D., Stefanski, L. A., & Crainiceanu, C. M. (2006). Measurement error in nonlinear models: a modern perspective. CRC press.
          • Buonaccorsi, J. P. (2010). Measurement error: models, methods, and applications. CRC Press.
          Zu 5) 
          • Carroll, R. J., Ruppert, D., Stefanski, L. A., & Crainiceanu, C. M. (2006). Measurement error in nonlinear models: a modern perspective. CRC press.
          • Buonaccorsi, J. P. (2010). Measurement error: models, methods, and applications. CRC Press.
          • Küchenhoff, H., Mwalili, S. M., & Lesaffre, E. (2006). A general method for dealing with misclassification in regression: the misclassification SIMEX. Biometrics, 62(1), 85-96.
          • Küchenhoff, H., Lederer, W., & Lesaffre, E. (2007). Asymptotic variance estimation for the misclassification SIMEX. Computational Statistics & Data Analysis, 51(12), 6197-6211.
          Zu 6) 
          • Allodji, R. S., Leuraud, K., Bernhard, S., Henry, S., Bénichou, J., & Laurier, D. (2012). Assessment of uncertainty associated with measuring exposure to radon and decay products in the French uranium miners cohort. Journal of Radiological Protection, 32(1), 85.

          • Allodji, R. S., Leuraud, K., Thiébaut, A. C., Henry, S., Laurier, D., & Bénichou, J. (2012). Impact of measurement error in radon exposure on the estimated excess relative risk of lung cancer death in a simulated study based on the French Uranium Miners’ Cohort. Radiation and environmental biophysics, 51(2), 151-163.

          • Hoffmann, S., Rage, E., Laurier, D., Laroche, P., Guihenneuc, C., & Ancelet, S. (2017). Accounting for Berkson and Classical Measurement Error in Radon Exposure Using a Bayesian Structural Approach in the Analysis of Lung Cancer Mortality in the French Cohort of Uranium Miners. Radiation Research187(2), 196-209.

          Zu 7) 
          • Carpenter, James, and Michael Kenward. Multiple imputation and its application. John Wiley & Sons, 2012.
          • Buuren, Stef, and Karin Groothuis-Oudshoorn. "mice: Multivariate imputation by chained equations in R." Journal of statistical software 45.3 (2011).
          Zu 8) 
          • Dempster, Arthur P., Nan M. Laird, and Donald B. Rubin. "Maximum likelihood from incomplete data via the EM algorithm." Journal of the royal statistical society. Series B (methodological) (1977): 1-38.
          • Wu, CF Jeff. "On the convergence properties of the EM algorithm." The Annals of statistics (1983): 95-103.

          Zu 9)

          • Selbstständige Recherche erwünscht

          Zu 10) 
          • Carroll, R. J., Ruppert, D., Stefanski, L. A., & Crainiceanu, C. M. (2006). Measurement error in nonlinear models: a modern perspective. CRC press.
          • Gustafson, P. (2003). Measurement error and misclassification in statistics and epidemiology: impacts and Bayesian adjustments. CRC Press.
          • Gelman, A., Carlin, J. B., Stern, H. S., & Rubin, D. B. (2014). Bayesian data analysis (Vol. 2). Boca Raton, FL, USA: Chapman & Hall/CRC.

          • Rubin, Donald B. "Inference and missing data." Biometrika (1976): 581-592.

          • Schafer, Joseph L. Analysis of incomplete multivariate data. CRC press, 1997.

          Zu 11) 
          • Blackwell, M., Honaker, J., & King, G. (2015). A Unified Approach to Measurement Error and Missing Data Overview and Applications. Sociological Methods & Research, 0049124115585360.

          • Blackwell, M., Honaker, J., & King, G. (2015). A Unified Approach to Measurement Error and Missing Data Details and Extensions. Sociological Methods & Research, 0049124115589052.

          • Honaker, James, Gary King, and Matthew Blackwell. "Amelia II: A program for missing data." Journal of statistical software 45.7 (2011): 1-47.