Zusammenfassung
Dieser Beitrag behandelt zwei breit einsetzbare Techniken zur Kompensation fehlender Werte: Die Gewichtung, die im Wesentlichen zur Kompensation fehlender Einheiten eingesetzt wird, und die Methode der multiplen Imputation, die im Wesentlichen zur Kompensation fehlender Werte von ansonsten beobachteten Einheiten verwendet wird. Die der Gewichtung zugrunde liegende Idee basiert darauf, dass diejenigen Einheiten mit einer geringeren Beobachtungswahrscheinlichkeit relativ zu jenen mit einer höheren Beobachtungswahrscheinlichkeit höher gewichtet werden. Bei der Methode der multiplen Imputation werden für jeden fehlenden Wert mehrere plausible Werte erzeugt, in deren Variation sich die mit diesen Schätzungen verknüpfte Unsicherheit widerspiegelt. Um die Einsatzmöglichkeiten beider Techniken, aber auch deren Grenzen beleuchten zu können, wird zunächst eine Einführung in die gängige Klassifikation der Mechanismen vorgestellt, die es erlaubt, zwischen Ignorierbarkeit und Nicht-Ignorierbarkeit des Missingmechanismus zu unterscheiden. Dieser Unterscheidung kommt eine wichtige Bedeutung zu, denn bei Ignorierbarkeit kann auf die fehleranfällige Modellierung des Missingmechanismus verzichtet werden. In weiteren Abschnitten werden die Methode der Gewichtung und die Methode der multiplen Imputation sowie deren Voraussetzungen ausführlich dargestellt und diskutiert. Dabei wird weitgehend davon ausgegangen, dass der Missingmechanismus ignorierbar ist. Sowohl die Gewichtung als auch die multiple Imputation können prinzipiell aber auch dann eingesetzt werden, wenn der Missingmechanismus nicht ignorierbar ist. In der Anwendung ist dies allerdings problematisch, denn in solchen Fällen wird Information von außerhalb der Stichprobe benötigt, etwa in Form von starken Annahmen, Restriktionen oder Daten. Diese steht jedoch oft nicht zur Verfügung. Der Einsatz beider Methoden wird anhand eines Beispiels veranschaulicht, nämlich der Schätzung einer Einkommensgleichung für Frauen. Zur Kompensation fehlender Personen werden die mit dem verwendeten Datensatz ausgelieferten Gewichte verwendet. Einzelne fehlende Werte werden mit Hilfe einer frei verfügbaren Software mehrfach imputiert.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literaturverzeichnis
Allison, P. D. (2002). Missing Data. Thousand Oaks: Sage.
Heckman, J. J. (1976). The Common Structure of Statistical Models of Truncation, Sample Selection and Limited Dependent Variables and a Simple Estimator for Such Models. Annals of Economic and Social Measurement, 5, 475–492.
Little, R. J. A. & Rubin, D. B. (2002). Statistical Analysis with Missing Data. New York: John Wiley, 2. Auflage.
Raghunathan, T. E., Solenberger, P., & van Hoewyk, J. (2002). IVEware: Imputation and Variance Estimation Software. User Guide. Ann Arbor: Institute for Social Research, University of Michigan.
Robins, J. M., Rotnitzky, A., & Zhao, L. (1995). Analysis of Semiparametric Regression Models for Repeated Outcomes in the Presence of Missing Data. Journal of the American Statistical Association, 90, 106–121.
Rubin, D. B. (1987). Multiple Imputation for Nonresponse in Surveys. New York: John Wiley & Sons.
Schafer, J. L. (1997). Analysis of Incomplete Multivariate Data. London: Chapman & Hall.
Spieß, M. (2008). Missing-Data Techniken. Münster: LIT Verlag.
Spieß, M. & Kroh, M. (2004). Documentation of Samples Sizes and Panel Attrition in the German Socio Economic Panel (SOEP) 1984–2003. In Data Documentation No. 1. Berlin: DIW.
Van der Klaauw, B. & Koning, R. H. (2003). Testing the Normality Assumption in the Sample Selection Model with an Application to Travel Demand. Journal of Business & Economic Statistics, 21, 31–42.
Wooldridge, J. M. (2002a). Econometric Analysis of Cross Section and Panel Data. Cambridge: MIT Press.
Wooldridge, J. M. (2002b). Inverse Probability Weighted M-Estimators for Sample Selection, Attrition and Stratification. Portugese Economic Journal, 1, 117–139.
Wooldridge, J. M. (2007). Inverse Probability Weighted Estimation for General Missing Data Problems. Journal of Econometrics, 141, 1281–1301.
Editor information
Rights and permissions
Copyright information
© 2010 VS Verlag fur Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH
About this chapter
Cite this chapter
Spieß, M. (2010). Der Umgang mit fehlenden Werten. In: Wolf, C., Best, H. (eds) Handbuch der sozialwissenschaftlichen Datenanalyse. VS Verlag für Sozialwissenschaften. https://doi.org/10.1007/978-3-531-92038-2_6
Download citation
DOI: https://doi.org/10.1007/978-3-531-92038-2_6
Publisher Name: VS Verlag für Sozialwissenschaften
Print ISBN: 978-3-531-16339-0
Online ISBN: 978-3-531-92038-2
eBook Packages: Humanities, Social Science (German Language)