EWR 13 (2014), Nr. 5 (September/Oktober)

Pierre W. Kemna
Messung pädagogischer Basiskompetenzen von Lehrerinnen und Lehrern
Entwicklung von Testinstrumenten
Münster / New York / München / Berlin: Waxmann 2012
(288 S.; ISBN 978-3-8309-2708-2; 38,00 EUR)
Messung pädagogischer Basiskompetenzen von Lehrerinnen und Lehrern Kompetenz hat sich in der zurückliegenden Dekade als zentraler Begriff einer Bildungsforschung etabliert, die den Blick zunehmend auf den Output von Bildungsprozessen richtet. Als möglicher Prädiktor für Schülerleistungen gerät auch die professionelle Kompetenz der Lehrkräfte in den Fokus. Die theoretische Modellierung professioneller Kompetenz von Lehrkräften sowie ihre standardisierte und valide Messung sind gegenwärtig zentrale Herausforderungen der Forschung zum Lehrerberuf und bilden ein Forschungsprogramm, an dem sich zahlreiche Akteure beteiligen (z. B. DFG-Schwerpunktprogramm „Kompetenzmodelle…“, TEDS-M, COACTIV, EMW, BilWiss), so auch Pierre W. Kemna, der sich in seiner Dissertation der Entwicklung von Testinstrumenten zur Messung fächerübergreifender pädagogischer Lehrerkompetenzen, sogenannter „pädagogischer Basiskompetenzen“, widmet.

In den ersten Kapiteln setzt sich Kemna ausführlich mit dem Kompetenzbegriff, seinen verschiedenen Definitionen und Ausdifferenzierungen sowie mit der Anwendung des Begriffs im Kontext der Lehrerforschung auseinander. Er gibt einen Überblick über verschiedene Strukturmodelle pädagogischer Handlungskompetenz und beschreibt Ansätze zu Standards in der Lehrerbildung, die er als Konkretisierungen der abstrakten Kompetenzstrukturmodelle versteht. Dass solche induktiv formulierten Standards (z. B. Oser) nicht als Ausdifferenzierung der Kompetenzmodelle entwickelt wurden und bei aller Plausibilität an fehlender theoretischer Fundierung leiden, thematisiert der Autor nicht.
Anstatt sich dem Modell professioneller Handlungskompetenz von Lehrkräften aus dem COACTIV-Kontext anzuschließen, das mittlerweile als nahezu paradigmatisch angesehen werden kann, greift der Autor für seine Arbeit auf ein älteres, nicht unmittelbar anschlussfähiges Konzept seines Mentors Karl-Oswald Bauer zurück: das Modell pädagogischer Basiskompetenzen, das ähnlich wie die Standards für die Lehrerbildung induktiv entwickelt wurde.

Aus den zahlreichen Dimensionen und Subdimensionen des Modells wählt der Autor, aufgrund forschungspragmatischer Erwägungen, die Bereiche Gruppenunterricht und Beratungsgespräche aus, um dazu standardisierte Messinstrumente zu entwickeln. Eine intensive literaturgestützte Auseinandersetzung mit diesen konkreten Aufgabenfeldern des Lehrerberufs erfolgt nicht. Im weiteren Verlauf der Arbeit bleibt eine Einordnung der entwickelten Messinstrumente für diese zwei Teilkompetenzen in ein größeres Ganzes weitgehend aus. Die Annahme, die beiden entwickelten Kompetenztests stünden „stellvertretend für die Gesamtheit der pädagogischen Basiskompetenzen“, da „die pädagogische Gesprächskompetenz und der Gruppenunterricht viele Facetten der pädagogischen Basiskompetenzen“ umfassen (77), wird weder belegt noch nachdrücklich vertreten. Der Titel des Buches, der eine breitere Anlage der Arbeit erwarten lässt, erscheint daher letztlich irreführend und zu ambitioniert.

Die unzureichende Anbindung der Arbeit an den Forschungsstand und die unklare theoretische Verortung schmälern die Stärken der vorliegenden Dissertation, in deren Zentrum eine elaborierte Testentwicklung steht.
Der Autor beschreibt die Konstruktion eines Multiple-Choice-Tests für den Kompetenzbereich Gruppenunterricht sowie die Überarbeitung eines bereits früher vom Autor entwickelten Tests zur pädagogischen Gesprächskompetenz. Beide Tests sollen nicht nur deklaratives Wissen erheben, sondern durch Aufgaben, die die Auswahl von Handlungsoptionen in hypothetischen Situationen erfordern, auch handlungsnah angewandtes Wissen.

Es folgen ausführliche Kapitel zur Eichung der Tests auf Grundlage sowohl der klassischen als auch der probabilistischen Testtheorie und umfangreiche Datenanalysen, die der Überprüfung der Gütekriterien der Messungen dienen.

Der Prüfung der Validität widmet der Autor große Aufmerksamkeit. Allerdings wird die Validitätsprüfung auf problematische Weise mit weitergehenden Erkenntnisinteressen verquickt. Kemna formuliert eine Reihe von forschungsleitenden Fragen und Hypothesen und entwickelt eigens ein drittes Messinstrument zur Erhebung der Schüler-Lehrer-Beziehung, da er direkte Zusammenhänge vermutet zwischen den gemessenen pädagogischen Kompetenzen und der persönlichen Schüler-Lehrer-Beziehung als basalem Qualitätsmerkmal von Unterricht. Ausführliche Datenanalysen sollen sowohl einen Erkenntnisgewinn hinsichtlich der aufgeworfenen Forschungsfragen liefern, als auch Klarheit über die Validität der neu entwickelten Messinstrumente bringen. Dieses Vorgehen stellt sich als problematisch heraus.

Der Prüfung der Validität einer Messung sollten gute Kenntnisse des gemessenen Konstrukts zugrunde liegen, die die Formulierung von Zusammenhangshypothesen mit anderen Konstrukten erlauben. Die Messung dieser herangezogenen Konstrukte sollte zudem bereits hinreichend validiert sein. Von diesen Grundsätzen weicht Kemna ab. Er validiert die neuen Messinstrumente anhand zahlreicher Konstrukte (Schulform, Unterrichtsfächer, Alter, Anzahl an Fortbildungen, erlebte pädagogische Wirksamkeit etc.), wobei es sich bei den Zusammenhangshypothesen bisweilen um ad-hoc-Hypothesen handelt, die nicht eingehend begründet werden. So zieht er zur Validierung der Messung pädagogischer Gesprächskompetenz unter anderem die Annahme heran, weibliche Lehrkräfte müssten bei Aufgaben mit „linguistischen Anforderungen“ besser abschneiden, da beispielsweise auch Schülerinnen bei Tests der Lesekompetenz bessere Ergebnisse erzielen.

Problematisch ist es zudem, wenn drei neu entwickelte Messinstrumente gegenseitig zur Validitätsprüfung herangezogen werden: Kompetenz im Gruppenunterricht und pädagogische Gesprächskompetenz erklären die persönliche Schüler-Lehrer-Beziehung nicht wie erwartet in substantiellem Maße. Der Autor geht davon aus, dass dieser Befund auf den fehlenden Zusammenhang zwischen den drei Konstrukten und nicht auf die Qualität der Messinstrumente zurückzuführen ist. Hypothesenkonforme Ergebnisse werden an anderen Stellen dagegen mitunter weitgehend als Bestätigung der Konstruktvalidität interpretiert.

Kemna stellt sein methodisches Vorgehen sehr kleinschrittig und detailliert dar. Er wählt damit eine lobenswert transparente Darstellungsweise, die alle methodischen Entscheidungen nachvollziehbar macht und jedes eingesetzte statistische Verfahren reflektiert und begründet. Bisweilen hätte es allerdings gut getan, Literaturexzerpte, Rohdaten und andere Details in Fußnoten oder Anhänge zu verlagern. Störend sind eingestreute Anekdoten aus dem Erhebungsprozess oder die Angabe irrelevanter Details. Zusammen mit der nicht immer plausiblen Gliederung des Textes macht es die Vielzahl der berichteten Details stellenweise schwer, der zentralen Argumentation des Autors zu folgen. Für explizite Interpretationen der Analyseergebnisse, prägnante Zusammenfassungen und (Zwischen-)Fazits wäre der Leser häufig dankbar gewesen.

Ihre Stärken hat die vorliegende Publikation im gründlichen und reflektierten Einsatz verschiedener statistischer Analysemethoden zur Testentwicklung und Testeichung. Um diese Stärken für die Forschung zur professionellen Kompetenz von Lehrkräften fruchtbar zu machen, bedarf es allerdings einer gründlicheren theoretischen Fundierung und einer anknüpfungsfähigen konzeptionellen Ausgestaltung.
Rolf Puderbach (Dresden)
Zur Zitierweise der Rezension:
Rolf Puderbach: Rezension von: Kemna, Pierre W.: Messung pädagogischer Basiskompetenzen von Lehrerinnen und Lehrern, Entwicklung von Testinstrumenten. Münster / New York / München / Berlin: Waxmann 2012. In: EWR 13 (2014), Nr. 5 (Veröffentlicht am 10.10.2014), URL: http://www.klinkhardt.de/ewr/978383092708.html