Skip to main content

Zusammenfassung

Dieser Beitrag behandelt zwei breit einsetzbare Techniken zur Kompensation fehlender Werte: Die Gewichtung, die im Wesentlichen zur Kompensation fehlender Einheiten eingesetzt wird, und die Methode der multiplen Imputation, die im Wesentlichen zur Kompensation fehlender Werte von ansonsten beobachteten Einheiten verwendet wird. Die der Gewichtung zugrunde liegende Idee basiert darauf, dass diejenigen Einheiten mit einer geringeren Beobachtungswahrscheinlichkeit relativ zu jenen mit einer höheren Beobachtungswahrscheinlichkeit höher gewichtet werden. Bei der Methode der multiplen Imputation werden für jeden fehlenden Wert mehrere plausible Werte erzeugt, in deren Variation sich die mit diesen Schätzungen verknüpfte Unsicherheit widerspiegelt. Um die Einsatzmöglichkeiten beider Techniken, aber auch deren Grenzen beleuchten zu können, wird zunächst eine Einführung in die gängige Klassifikation der Mechanismen vorgestellt, die es erlaubt, zwischen Ignorierbarkeit und Nicht-Ignorierbarkeit des Missingmechanismus zu unterscheiden. Dieser Unterscheidung kommt eine wichtige Bedeutung zu, denn bei Ignorierbarkeit kann auf die fehleranfällige Modellierung des Missingmechanismus verzichtet werden. In weiteren Abschnitten werden die Methode der Gewichtung und die Methode der multiplen Imputation sowie deren Voraussetzungen ausführlich dargestellt und diskutiert. Dabei wird weitgehend davon ausgegangen, dass der Missingmechanismus ignorierbar ist. Sowohl die Gewichtung als auch die multiple Imputation können prinzipiell aber auch dann eingesetzt werden, wenn der Missingmechanismus nicht ignorierbar ist. In der Anwendung ist dies allerdings problematisch, denn in solchen Fällen wird Information von außerhalb der Stichprobe benötigt, etwa in Form von starken Annahmen, Restriktionen oder Daten. Diese steht jedoch oft nicht zur Verfügung. Der Einsatz beider Methoden wird anhand eines Beispiels veranschaulicht, nämlich der Schätzung einer Einkommensgleichung für Frauen. Zur Kompensation fehlender Personen werden die mit dem verwendeten Datensatz ausgelieferten Gewichte verwendet. Einzelne fehlende Werte werden mit Hilfe einer frei verfügbaren Software mehrfach imputiert.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 139.00
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literaturverzeichnis

  • Allison, P. D. (2002). Missing Data. Thousand Oaks: Sage.

    Google Scholar 

  • Heckman, J. J. (1976). The Common Structure of Statistical Models of Truncation, Sample Selection and Limited Dependent Variables and a Simple Estimator for Such Models. Annals of Economic and Social Measurement, 5, 475–492.

    Google Scholar 

  • Little, R. J. A. & Rubin, D. B. (2002). Statistical Analysis with Missing Data. New York: John Wiley, 2. Auflage.

    Google Scholar 

  • Raghunathan, T. E., Solenberger, P., & van Hoewyk, J. (2002). IVEware: Imputation and Variance Estimation Software. User Guide. Ann Arbor: Institute for Social Research, University of Michigan.

    Google Scholar 

  • Robins, J. M., Rotnitzky, A., & Zhao, L. (1995). Analysis of Semiparametric Regression Models for Repeated Outcomes in the Presence of Missing Data. Journal of the American Statistical Association, 90, 106–121.

    Article  Google Scholar 

  • Rubin, D. B. (1987). Multiple Imputation for Nonresponse in Surveys. New York: John Wiley & Sons.

    Book  Google Scholar 

  • Schafer, J. L. (1997). Analysis of Incomplete Multivariate Data. London: Chapman & Hall.

    Book  Google Scholar 

  • Spieß, M. (2008). Missing-Data Techniken. Münster: LIT Verlag.

    Google Scholar 

  • Spieß, M. & Kroh, M. (2004). Documentation of Samples Sizes and Panel Attrition in the German Socio Economic Panel (SOEP) 1984–2003. In Data Documentation No. 1. Berlin: DIW.

    Google Scholar 

  • Van der Klaauw, B. & Koning, R. H. (2003). Testing the Normality Assumption in the Sample Selection Model with an Application to Travel Demand. Journal of Business & Economic Statistics, 21, 31–42.

    Article  Google Scholar 

  • Wooldridge, J. M. (2002a). Econometric Analysis of Cross Section and Panel Data. Cambridge: MIT Press.

    Google Scholar 

  • Wooldridge, J. M. (2002b). Inverse Probability Weighted M-Estimators for Sample Selection, Attrition and Stratification. Portugese Economic Journal, 1, 117–139.

    Article  Google Scholar 

  • Wooldridge, J. M. (2007). Inverse Probability Weighted Estimation for General Missing Data Problems. Journal of Econometrics, 141, 1281–1301.

    Article  Google Scholar 

Download references

Authors

Editor information

Christof Wolf Henning Best

Rights and permissions

Reprints and permissions

Copyright information

© 2010 VS Verlag fur Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH

About this chapter

Cite this chapter

Spieß, M. (2010). Der Umgang mit fehlenden Werten. In: Wolf, C., Best, H. (eds) Handbuch der sozialwissenschaftlichen Datenanalyse. VS Verlag für Sozialwissenschaften. https://doi.org/10.1007/978-3-531-92038-2_6

Download citation

  • DOI: https://doi.org/10.1007/978-3-531-92038-2_6

  • Publisher Name: VS Verlag für Sozialwissenschaften

  • Print ISBN: 978-3-531-16339-0

  • Online ISBN: 978-3-531-92038-2

  • eBook Packages: Humanities, Social Science (German Language)

Publish with us

Policies and ethics