Zusammenfassung
Die Klassische Testtheorie (KTT) bietet theoretische Grundlagen zur Konstruktion von Testverfahren und zur Interpretation von Testwerten. Für die meist messfehlerbehafteten manifesten Itemvariablen lassen sich anhand der KTT Messmodelle formulieren, um den Anteil der wahren Werte vom Anteil der Fehlerwerte zu trennen und darauf aufbauend individuelle Testwerte zu bestimmen und die Reliabilität der Testwertvariablen zu schätzen. Die Items eines Tests können unterschiedliche Messeigenschaften aufweisen und lassen sich daher hinsichtlich ihrer Messäquivalenz beschreiben. Die Messäquivalenz kann anhand verschiedener Messmodelle überprüft werden, die auf unterschiedlich restriktiven, testbaren Annahmen basieren. Abhängig von der gegebenen Messäquivalenz können verschiedene Reliabilitätskoeffizienten geschätzt werden, die zusätzlich durch ein Konfidenzintervall ergänzt werden sollten. Neben eindimensionalen Modellen werden auch mehrdimensionale Ansätze, z. B. die Generalisierbarkeitstheorie, behandelt, die auf der KTT aufbauen und explizit mehrere latente Variablen als systematische Varianzquellen berücksichtigen.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Wurde die Reliabilität anhand der CFA geschätzt, so ist ein adäquater Standardfehler vorhanden, der nicht nach diesem vereinfachten Verfahren berechnet werden muss.
Literatur
Amend, N. (2015). Who’s perfect? Pilotstudie zur Untersuchung potenzieller Korrelatedes Merkmals Perfektionismus. Unveröffentlichte Bachelorarbeit, Institut für Psychologie, Goethe Universität, Frankfurt am Main.
Bandalos, D. L. (2018). Measurement Theory and Applications for the Social Sciences. New York, NY: The Guilford Press.
Bollen, K. A. (1989). Structural equations with latent variables. New York, NY: Wiley.
Brennan, R. L. (2001). Generalizability Theory. New York, NY: Springer.
Brennan, R. L. (2011). Generalizability theory and classical test theory. Applied Measurement in Education, 24, 1–21.
Brown, W. (1910). Some experimental results in the correlation of mental abilities. British Journal of Psychology, 3, 296–322.
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 297–334.
Cronbach, L. J., Gleser, G. C., Nanda, H. & Rajaratnam, N. (1972). The dependability of behavioral measurements: Theory of generalizability scores and profiles. New York, NY: Wiley.
Cronbach, L. J., Rajaratnam, N. & Gleser, G. C. (1963). Theory of generalizability: A liberalization of reliability theory. British Journal of Statistical Psychology, 16, 137–163.
DeMars, C. E. (2018). Classical test theory and item response theory. In P. Irwing, T. Booth & D. J. Hughes (Eds.), The Wiley Handbook of Psychometric Testing: A Multidisciplinary Reference on Survey, Scale and Test Development (pp. 49–74). Hoboken, NJ: Wiley.
Eid, M. & Schmidt, K. (2014). Testtheorie und Testkonstruktion. Göttingen: Hogrefe.
Eid, M., Gollwitzer, M. & Schmitt, M. (2017). Statistik und Forschungsmethoden (5. Aufl.). Weinheim: Beltz.
Eid, M., Nussbeck, F., Geiser, C., Cole, D., Gollwitzer, M. & Lischetzke, T. (2008). Structural equation modeling of multitrait-multimethod data: Different models for different types of methods. Psychological Methods, 13, 230–253.
Fischer, G. H. (1974). Einführung in die Theorie psychologischer Tests. Bern: Huber.
Geiser C. & Lockhart, G. (2012). A comparison of four approaches to account for method effects in latent state-trait analyses. Psychological Methods, 17, 255–283.
Gleser, G. C., Cronbach, L. J. & Rajaratnam, N. (1965). Generalizability of scores influenced by multiple sources of variance. Psychometrika, 30, 395–418.
Gulliksen, H. (1950). Theory of Mental Tests. New York, NY: Wiley.
Guttman, L. (1945). A basis for analyzing test-retest reliability. Psychometrika, 10, 255–282.
Jöreskog, K. G. (1971). Statistical analysis of sets of congeneric tests. Psychometrika, 36, 109–133.
Kelley, K. & Pornprasertmanit, S. (2016). Confidence intervals for population reliability coefficients: Evaluation of methods, recommendations, and software for homogeneous composite measures. Psychological Methods, 21, 69–92.
Lord, F. M. & Novick, M. R. (1968). Statistical theories of mental test scores. Reading, MA: Addison-Wesley.
Marcoulides, G. A. (1996). Estimating variance components in generalizability theory. Structural Equation Modeling, 3, 290–299.
Moosbrugger, H. (1983). Modelle zur Beschreibung statistischer Zusammenhänge in der psychologischen Forschung. In J. Bredenkamp & H. Feger (Hrsg.), Strukturierung und Reduzierung von Daten. Enzyklopädie der Psychologie, Serie I: Forschungsmethoden der Psychologie (Bd. 4, S. 1–58). Göttingen: Hogrefe.
Muthén, L. K. & Muthén, B. O. (2017). Mplus User’s Guide (8th ed.). Los Angeles, CA: Muthén & Muthén.
Rammstedt, B. & John, O. P. (2005). Kurzversion des Big Five Inventory (BFI-K): Entwicklung und Validierung eines ökonomischen Inventars zur Erfassung der fünf Faktoren der Persönlichkeit. Diagnostica, 51, 195–206.
Rauch, W. & Moosbrugger, H. (2011). Klassische Testtheorie: Grundlagen und Erweiterungen für heterogene Tests und Mehrfacettenmodelle. In L. F. Hornke, M. Amelang & M. Kersting (Hrsg.), Methoden der psychologischen Diagnostik. Enzyklopädie der Psychologie. Themenbereich B, Methodologie und Methoden. Serie II, Psychologische Diagnostik (Bd. 2, S. 1–86). Göttingen: Hogrefe.
Raykov, T. (2002) Analytic estimation of standard error and confidence interval for scale reliability. Multivariate Behavioral Research, 37, 89–103.
Raykov, T. & Marcoulides, G. A. (2004). Using the delta method for approximate interval estimation of parameter functions in SEM. Structural Equation Modeling, 11, 621–637.
Raykov, T. & Marcoulides, G. A. (2006). Estimation of generalizability coefficients via a structural equation modeling approach to scale reliability evaluation. International Journal of Testing, 6, 81–95.
Raykov, T. & Marcoulides, G. A. (2011). Introduction to Psychometric Theory. New York, NY: Routledge.
Raykov, T. & Marcoulides, G. A. (2016). On the relationship between classical test theory and item response theory: From one to the other and back. Educational and Psychological Measurement, 76, 325–338.
Revelle, W. & Condon, D. M. (2018). Reliability. In P. Irwing, T. Booth & D. Hughes (Eds.), The Wiley-Blackwell Handbook of Psychometric Testing. West Sussex, UK: Blackwell Publishing Ltd.
Rosseel, Y. (2012). lavaan: An R Package for Structural Equation Modeling. Journal of Statistical Software, 48, 1–36.
Schermelleh-Engel, K., Moosbrugger, H. & Müller, H. (2003). Evaluating the fit of structural equation models: Tests of significance and descriptive goodness-of-fit measures. Methods of Psychological Research Online, 8, 23–74.
Schmidt-Atzert, L. & Amelang, M. (2012). Psychologische Diagnostik (5. Aufl.). Berlin, Heidelberg: Springer.
Skrondal, A. & Rabe-Hesketh, S. (2014). Generalized latent variable modeling. Multilevel, longitudinal, and structural equation models (2nd ed.). Boca Rota: Chapman & Hall.
Spearman, C. (1904a). The proof and measurement of association between two things. American Journal of Psychology, 15, 72–101.
Spearman, C. (1904b). “General Intelligence”, objectively determined and measured. American Journal of Psychology, 15, 201–292.
Spearman, C. (1910). Correlation calculated from faulty data. British Journal of Psychology, 3, 171–195.
Steyer, R. (1989). Models of classical psychometric test theory as stochastic measurement models: Representation, uniqueness, meaningfulness, identifiability, and testability. Methodika, 3, 25–60.
Steyer, R. & Eid, M. (2001). Messen und Testen. Berlin, Heidelberg: Springer.
Steyer, R., Mayer, A., Geiser, C. & Cole, D. A. (2015). A Theory of States and Traits – Revised. Annual Review of Clinical Psychology, 11, 71–98.
Thomson, G. H. (1938). The factorial analysis of human ability. London: University of London Press.
Thurstone, L. L. (1935). The vectors of mind: Multiple-factor analysis for the isolation of primary traits. Chicago, IL: University of Chicago Press.
Vispoel, W. P., Morris, C. A. & Kilinc, M. (2018). Applications of generalizability theory and their relations to classical test theory and structural equation modeling. Psychological Methods, 23, 1–26.
Vispoel, W. P., Morris, C. A. & Kilinc, M. (2019). Using generalizability theory with continuous latent response variables. Psychological Methods, 24, 153–178.
Yousfi, S. & Steyer, R. (2006). Klassische Testtheorie. In F. Petermann & M. Eid (Hrsg.), Handbuch der Psychologischen Diagnostik (S. 288–303). Göttingen: Hogrefe.
Zimmerman, D. W. (1975). Probability spaces, Hilbert spaces, and the axioms of test theory. Psychometrika, 40, 395–412.
Zimmerman, D. W. (1976). Test theory with minimal assumptions. Educational and Psychological Measurement, 36, 85–96.
Author information
Authors and Affiliations
Corresponding author
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 2020 Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature
About this chapter
Cite this chapter
Moosbrugger, H., Gäde, J.C., Schermelleh-Engel, K., Rauch, W. (2020). Klassische Testtheorie (KTT). In: Moosbrugger, H., Kelava, A. (eds) Testtheorie und Fragebogenkonstruktion. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-61532-4_13
Download citation
DOI: https://doi.org/10.1007/978-3-662-61532-4_13
Published:
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-662-61531-7
Online ISBN: 978-3-662-61532-4
eBook Packages: Psychology (German Language)