Der Umgang mit fehlenden Werten

Spieß, Martin

doi:10.1007/978-3-531-92038-2_6

Martin Spieß

68k Accesses
14 Citations

Zusammenfassung

Dieser Beitrag behandelt zwei breit einsetzbare Techniken zur Kompensation fehlender Werte: Die Gewichtung, die im Wesentlichen zur Kompensation fehlender Einheiten eingesetzt wird, und die Methode der multiplen Imputation, die im Wesentlichen zur Kompensation fehlender Werte von ansonsten beobachteten Einheiten verwendet wird. Die der Gewichtung zugrunde liegende Idee basiert darauf, dass diejenigen Einheiten mit einer geringeren Beobachtungswahrscheinlichkeit relativ zu jenen mit einer höheren Beobachtungswahrscheinlichkeit höher gewichtet werden. Bei der Methode der multiplen Imputation werden für jeden fehlenden Wert mehrere plausible Werte erzeugt, in deren Variation sich die mit diesen Schätzungen verknüpfte Unsicherheit widerspiegelt. Um die Einsatzmöglichkeiten beider Techniken, aber auch deren Grenzen beleuchten zu können, wird zunächst eine Einführung in die gängige Klassifikation der Mechanismen vorgestellt, die es erlaubt, zwischen Ignorierbarkeit und Nicht-Ignorierbarkeit des Missingmechanismus zu unterscheiden. Dieser Unterscheidung kommt eine wichtige Bedeutung zu, denn bei Ignorierbarkeit kann auf die fehleranfällige Modellierung des Missingmechanismus verzichtet werden. In weiteren Abschnitten werden die Methode der Gewichtung und die Methode der multiplen Imputation sowie deren Voraussetzungen ausführlich dargestellt und diskutiert. Dabei wird weitgehend davon ausgegangen, dass der Missingmechanismus ignorierbar ist. Sowohl die Gewichtung als auch die multiple Imputation können prinzipiell aber auch dann eingesetzt werden, wenn der Missingmechanismus nicht ignorierbar ist. In der Anwendung ist dies allerdings problematisch, denn in solchen Fällen wird Information von außerhalb der Stichprobe benötigt, etwa in Form von starken Annahmen, Restriktionen oder Daten. Diese steht jedoch oft nicht zur Verfügung. Der Einsatz beider Methoden wird anhand eines Beispiels veranschaulicht, nämlich der Schätzung einer Einkommensgleichung für Frauen. Zur Kompensation fehlender Personen werden die mit dem verwendeten Datensatz ausgelieferten Gewichte verwendet. Einzelne fehlende Werte werden mit Hilfe einer frei verfügbaren Software mehrfach imputiert.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 139.00; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literaturverzeichnis

Allison, P. D. (2002). Missing Data. Thousand Oaks: Sage.
Google Scholar
Heckman, J. J. (1976). The Common Structure of Statistical Models of Truncation, Sample Selection and Limited Dependent Variables and a Simple Estimator for Such Models. Annals of Economic and Social Measurement, 5, 475–492.
Google Scholar
Little, R. J. A. & Rubin, D. B. (2002). Statistical Analysis with Missing Data. New York: John Wiley, 2. Auflage.
Google Scholar
Raghunathan, T. E., Solenberger, P., & van Hoewyk, J. (2002). IVEware: Imputation and Variance Estimation Software. User Guide. Ann Arbor: Institute for Social Research, University of Michigan.
Google Scholar
Robins, J. M., Rotnitzky, A., & Zhao, L. (1995). Analysis of Semiparametric Regression Models for Repeated Outcomes in the Presence of Missing Data. Journal of the American Statistical Association, 90, 106–121.
Article Google Scholar
Rubin, D. B. (1987). Multiple Imputation for Nonresponse in Surveys. New York: John Wiley & Sons.
Book Google Scholar
Schafer, J. L. (1997). Analysis of Incomplete Multivariate Data. London: Chapman & Hall.
Book Google Scholar
Spieß, M. (2008). Missing-Data Techniken. Münster: LIT Verlag.
Google Scholar
Spieß, M. & Kroh, M. (2004). Documentation of Samples Sizes and Panel Attrition in the German Socio Economic Panel (SOEP) 1984–2003. In Data Documentation No. 1. Berlin: DIW.
Google Scholar
Van der Klaauw, B. & Koning, R. H. (2003). Testing the Normality Assumption in the Sample Selection Model with an Application to Travel Demand. Journal of Business & Economic Statistics, 21, 31–42.
Article Google Scholar
Wooldridge, J. M. (2002a). Econometric Analysis of Cross Section and Panel Data. Cambridge: MIT Press.
Google Scholar
Wooldridge, J. M. (2002b). Inverse Probability Weighted M-Estimators for Sample Selection, Attrition and Stratification. Portugese Economic Journal, 1, 117–139.
Article Google Scholar
Wooldridge, J. M. (2007). Inverse Probability Weighted Estimation for General Missing Data Problems. Journal of Econometrics, 141, 1281–1301.
Article Google Scholar

Download references

Authors

Martin Spieß
View author publications
You can also search for this author in PubMed Google Scholar

Editor information

Christof Wolf Henning Best

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Spieß, M. (2010). Der Umgang mit fehlenden Werten. In: Wolf, C., Best, H. (eds) Handbuch der sozialwissenschaftlichen Datenanalyse. VS Verlag für Sozialwissenschaften. https://doi.org/10.1007/978-3-531-92038-2_6

Download citation

DOI: https://doi.org/10.1007/978-3-531-92038-2_6
Publisher Name: VS Verlag für Sozialwissenschaften
Print ISBN: 978-3-531-16339-0
Online ISBN: 978-3-531-92038-2
eBook Packages: Humanities, Social Science (German Language)

Publish with us

Policies and ethics