Verlag Julius Klinkhardt: EWR 5 (2006), Nr. 4 (Juli/August 2006): RÃ¼ckmeldung und Rezeption von Forschungsergebnissen

EWR 5 (2006), Nr. 4 (Juli/August 2006)

Harm Kuper / Julia Schneewind (Hrsg.)

RÃ¼ckmeldung und Rezeption von Forschungsergebnissen

New York, MÃ¼nchen, Berlin: Waxmann 2006

(146 S.; ISBN 3-8309-1640-X; 24,90 EUR)

RÃ¼ckmeldung und Rezeption von Forschungsergebnissen

Der pÃ¤dagogische Nutzen von Bildungsstandards und zentralen Lernstandserhebungen hÃ¤ngt unter anderem davon ab, wie an Schulen mit LeistungsrÃ¼ckmeldungen weitergearbeitet wird. Bereits nach TIMSS und PISA wurde gefragt, ob und in welchem MaÃŸe eine Rezeption bei den Praktikern vor Ort stattfindet. Die flÃ¤chendeckende DurchfÃ¼hrung von Tests auf LÃ¤nderebene sowie deren enge Kopplung an Curricula und Standards ermÃ¶glicht mittlerweile konkrete Formen der schul- und unterrichtsspezifischen DatenrÃ¼ckmeldung und fÃ¼hrt somit zu Fragen der Rezeption, Akzeptanz und NÃ¼tzlichkeit dieser Daten aus Sicht der LehrkrÃ¤fte. Diesem Forschungsinteresse widmen sich die sieben BeitrÃ¤ge in dem von Kuper und Schneewind herausgegebenen Band "RÃ¼ckmeldung und Rezeption von Forschungsergebnissen". Forschungsergebnisse werden dabei von den Autoren durchaus als breiter Begriff verstanden. Es geht nicht nur um die viel diskutierten RÃ¼ckmeldungen flÃ¤chendeckender Leistungsstudien, sondern um die Rezeption bildungswissenschaftlichen Wissens an Schulen insgesamt. Diese erweiterte Perspektive birgt allerdings auch die Gefahr der Zersplitterung, denn RÃ¼ckmeldungen von zentralen Vergleichsarbeiten kÃ¶nnen nur bedingt mit RÃ¼ckmeldungen bei kleineren Interventionsstudien mit freiwilliger Teilnahme verglichen werden.

Die ersten drei BeitrÃ¤ge fokussieren Leistungsuntersuchungen auf LÃ¤nderebene. Hier werden prominente Beispiele vorgestellt und erste Ergebnisse von Rezeptionsstudien im Hinblick auf eine Verbesserung der RÃ¼ckmeldepraxis diskutiert. Die vier BeitrÃ¤ge des zweiten Teils sind Ã¼berschrieben mit â€žRezeption und RÃ¼ckmeldung in der Mehrebenenstruktur des Bildungssystemsâ€œ. Hier bekommt der Leser Einblicke in die RÃ¼ckmeldestudien der Forschungsprojekte DESI, IBUS und BeLesen. In einem abschlieÃŸenden Beitrag wird der Umgang mit Evaluationsergebnissen aus Sicht eines Vertreters der Bildungsadministration reflektiert. Eine Systematisierung und Verallgemeinerung des bisherigen Forschungsstandes ist noch nicht mÃ¶glich und wird in diesem Band auch nicht vorgenommen.

In einem einleitenden Kapitel stellt Kuper die Forschungen zur Rezeption und Nutzbarmachung von ErgebnisrÃ¼ckmeldungen aus Leistungsstudien in den Kontext der erziehungswissenschaftlichen Theorie-Praxis-Problematik und fragt zunÃ¤chst allgemein nach der Verwendung wissenschaftlichen Wissens in der pÃ¤dagogischen Praxis. Seiner Ansicht nach kommt die theoretische Reflexion an dieser Stelle mit dem viel zitierten Dualismus zwischen Wissenschaft als Sozialtechnologie und Wissenschaft als AufklÃ¤rung nicht weiter. Vielmehr kann ProfessionalitÃ¤t als â€ždritte Instanzâ€œ zwischen den Wissensformen moderieren: â€žIm Sinne einer strukturellen Analyse der Vermittlung zwischen wissenschaftlichem und praktischem Wissen bietet sich die Fokussierung auf ProfessionalitÃ¤t im Bildungssystem an" (9). Mit dieser strukturtheoretischen Sichtweise auf ProfessionalitÃ¤t als Scharnierstelle zwischen Wissenschaft und praktischen Handlungserfordernissen intendiert Kuper nicht nur eine Diskussion um die praktische Verwendung wissenschaftlicher Daten, vielmehr ist fÃ¼r ihn â€ždie Einsicht der Professionellen in die theoretischen und methodischen Grundlagen der Bildungsforschung (10)" ein ausschlaggebender Aspekt.

Ein weiterer wichtiger Aspekt, der in dieser EinfÃ¼hrung herausgearbeitet wird, ist die Rolle der ProfessionalitÃ¤t als dritte Instanz zwischen staatlichen und marktwirtschaftlichen Regelungsmechanismen. Dies ist von Bedeutung, weil die Rezeption von LeistungsrÃ¼ckmeldungen in die weiter gespannte Diskussion um ein neues Steuerungsparadigma eingebettet ist. Wer hat die Deutungshoheit Ã¼ber welche Daten? Wer soll bzw. kann mit welchen Daten bestimmte Handlungen initiieren bzw. legitimieren? FÃ¼r Kuper sind dies ungeklÃ¤rte Fragen, deren Beantwortung nur im professionellen Diskurs mÃ¶glich ist: â€žFÃ¼r eine professionelle Verwendung der Ergebnisse der Bildungsforschung ist Entscheidungsautonomie unerlÃ¤sslich (...) Das erfordert allerdings eine starke Kultur der Auseinandersetzung mit Befunden der Bildungsforschung in einer professionsinternen Ã–ffentlichkeit" (11). Diese einleitenden Ãœberlegungen verweisen alle ForschungsaktivitÃ¤ten im nÃ¤heren und weiteren Umfeld von Schulleistungsstudien auf den zentralen Ort pÃ¤dagogischen Handelns: Die Gestaltung von Unterricht durch autonome und professionelle LehrkrÃ¤fte. Eine sinnvolle Koppelung von Bildungsforschung und pÃ¤dagogischer Praxis kann fÃ¼r Kuper nur bedeuten, dass die professionell TÃ¤tigen vor Ort in die Lage versetzt werden, selbstÃ¤ndig die Ergebnisse von Leistungsstudien reflektieren und in Handlungen umsetzen zu kÃ¶nnen. Diese Maxime Ã¼berzeugt und wird in den folgenden BeitrÃ¤gen aufgegriffen.

Im ersten Beitrag stellen GroÃŸ Ophoff, Koch, Hosenfeld und Helmke die VERA-RÃ¼ckmeldekonzeption vor und referieren erste Ergebnisse einer Lehrerbefragung. Die Ziele der VERA-Vergleichsarbeiten fÃ¼r die Grundschule sind vielfÃ¤ltig und ambitioniert und es ist nur recht und billig, wenn Anstrengungen unternommen werden, deren Erreichbarkeit auch zu Ã¼berprÃ¼fen. Die Autoren betonen dabei vor allem die VerstÃ¤ndlichkeit und NÃ¼tzlichkeit der zurÃ¼ckgemeldeten Leistungsdaten als wichtiges Kriterien fÃ¼r die Brauchbarkeit von Vergleichsarbeiten: â€žDie LehrkrÃ¤fte sollen gewissermaÃŸen als Experten fÃ¼r ihren eigenen Unterricht in die Ergebnisinterpretation und die Konsequenzen fÃ¼r den Unterricht einbezogen und so zur ergebnisorientierten Unterrichtsentwicklung angeregt werden" (22). Chance und Gefahr zugleich sind dabei die vielfÃ¤ltigen VergleichsmÃ¶glichkeiten, die VERA den GrundschullehrkrÃ¤ften anbietet. Dies wird von den Autoren erkannt und herausgearbeitet.

Die empirische Basis der VERA-Evaluationsstudie ist eine internetbasierte Befragung von LehrkrÃ¤ften aus der Zentralstichprobe. Die LehrkrÃ¤fte schÃ¤tzen ihren Handlungsspielraum im Umgang mit den Leistungsdaten als relativ gering ein. Noch vergleichsweise hoch wird der Nutzen von Vergleichsarbeiten fÃ¼r die Ableitung von FÃ¶rdermaÃŸnahmen bzw. das Erkennen von Fehlerschwerpunkten gesehen. Dagegen mÃ¶chte nur jede zehnte Grundschullehrerin aus den zurÃ¼ckgemeldeten Ergebnissen MaÃŸnahmen fÃ¼r den eigenen Unterricht ableiten; an eine eventuelle VerÃ¤nderung des Unterrichts denken gerade mal 5%. Es stellt sich die Frage, ob GroÃŸ Ophoff, Koch, Hosenfeld und Helmke hieraus die richtigen Konsequenzen ziehen. In einer weiteren systematischen Lehrerbefragung mÃ¶chten sie lediglich die VerstÃ¤ndlichkeit des RÃ¼ckmeldeformats und die VerÃ¤nderungswirkungen auf Unterrichtsebene noch genauer erfragen, um auf diese Weise das Leistungsfeedback optimieren zu kÃ¶nnen. Inwiefern wissenschaftlich ermittelte Leistungsdaten und handlungsleitende, subjektive Theorien der LehrkrÃ¤fte kompatibel sind, wird auch durch diese erweiterte Befragung nicht aufklÃ¤ren kÃ¶nnen.

Peek und Dobbelstein stellen das RÃ¼ckmeldeformat fÃ¼r die Lernstandserhebungen in der Sekundarstufe I in Nordrhein-Westfalen dar. Die Wissenschaftler bieten den Schulen eine differenzierte Ergebnisaufbereitung an, die sich an den BedÃ¼rfnissen der LehrkrÃ¤fte vor Ort orientieren soll. Die LehrkrÃ¤fte kÃ¶nnen zum Beispiel die Vergleichsgruppen frei wÃ¤hlen. Die Autoren betonen ebenfalls die DignitÃ¤t der schulinternen Verarbeitung von Evaluationsdaten. Beispielsweise sind die Schulen dazu verpflichtet worden, in der Schulkonferenz Ã¼ber die Ergebnisse, deren Interpretation und daraus gezogene Konsequenzen zu berichten. Erst danach erfolgt die Berichterstattung an die Schulaufsicht. Diese Vorgaben deuten darauf hin, dass auch in diesem Vergleichsarbeitenprojekt auf eine autonome Verarbeitung der Daten durch professionelle LehrkrÃ¤fte gesetzt wird.

Ãœber die tatsÃ¤chlich praktizierte Einbettung der Daten in Schul- und Unterrichtsentwicklungsprozesse kÃ¶nnen Peek und Dobbelstein allerdings nur spekulieren. Die RÃ¼ckmeldung wurde nicht systematisch evaluiert und die bisher gemachten Erfahrungen basieren auf spontanen LehrerÃ¤uÃŸerungen. Der Tenor dieses explorativen Feedbacks: Die Akzeptanz der Tests, die KompatibilitÃ¤t der aufbereiteten Leistungsdaten mit fachdidaktischen Vorstellungen und die kollegiale Kooperation sind wesentliche Bedingung fÃ¼r deren NÃ¼tzlichkeit. Auch in diesem Beitrag bleiben am Ende mehr Forderungen und Fragen als Antworten.

Nachtigall und KrÃ¶hne diskutieren messtheoretische Anforderungen an Vergleichsarbeiten und erlÃ¤utern in Bezug auf zentrale Leistungserhebungen die Vor- und Nachteile der probabilistischen gegenÃ¼ber der klassischen Testtheorie. Im weiteren Verlauf des Beitrags steht die Problematik fairer Vergleiche bei Leistungsstudien im Vordergrund. An einfachen Beispielen und Modellen werden mÃ¶gliche Fehlinterpretationen nicht justierter Daten veranschaulicht. Vor allem fÃ¼r die Akzeptanz von Tests und LeistungsrÃ¼ckmeldungen ist dieser Aspekt von immenser Bedeutung. Interessant und wichtig ist deshalb auch die Systematisierung unterschiedlicher MÃ¶glichkeiten zur Berechnung fairer Vergleichswerte. Den grÃ¶ÃŸten pÃ¤dagogischen Nutzen sehen Nachtigall und KrÃ¶hne bei fairen Vergleiche zwischen Unterrichtsinhalten. FÃ¼r die LehrkrÃ¤fte werden StÃ¤rken und SchwÃ¤chen des Unterrichts sichtbar, die sich nicht auf Kontextmerkmale abwÃ¤lzen lassen: â€žAus unserer Sicht bilden solche Vergleiche den Erfolg versprechendsten Ansatz fÃ¼r Unterrichts- und Schulentwicklung" (70).

Trotz aller methodologischen Fortschritte machen die Autoren auf weitere praktische und theoretische Probleme aufmerksam, die sich auch in absehbarer Zeit nicht ausrÃ¤umen lassen. Im Rahmen von Schulleistungsstudien kÃ¶nnen beispielsweise nie alle relevanten Kontextbedingungen vollstÃ¤ndig erfasst werden. Die groÃŸe Bedeutung des Vorwissens wÃ¼rde beispielsweise ein lÃ¤ngsschnittliches Design implizieren. Die Unsicherheit lÃ¤sst sich reduzieren, jedoch nicht aufheben und sollte von allen Beteiligten bei der Interpretation der Daten mit einberechnet werden. VÃ¶llig sicher sind sich Nachtigall und KrÃ¶hne jedoch in einem Punkt, der sich wie ein roter Faden durch den Band zieht: Auf jeden Fall sollten unfaire Vergleiche in der Ã–ffentlichkeit vermieden werden. Die Presse ist an Rankings interessiert und nicht an Schulentwicklung.

Von der Gathen skizziert in seinem Beitrag die an DESI gekoppelte RÃ¼ckmeldestudie und diskutiert forschungsleitende Fragen. Ergebnisse kann er noch nicht vorlegen. Die Leitfragen fÃ¼r die Fallstudien machen jedoch deutlich, dass auch hier die Einbindung der zurÃ¼ckgemeldeten Leistungsdaten in die schulinterne QualitÃ¤tsdiskussion untersucht werden soll. Man darf auf die Befunde gespannt sein. Ansonsten werden in diesem Beitrag einige ausgewÃ¤hlte und interessante Befunde der internationalen Rezeptionsforschung diskutiert. Die Fokussierung dieser Befunde auf die Fragestellung der vorgestellten DESI-RÃ¼ckmeldestudie kÃ¶nnte schlÃ¼ssiger sein.

Thiel und Ulber beschÃ¤ftigen sich nicht mit der Rezeption zentraler LeistungsrÃ¼ckmeldungen, sondern mit einem an der FU Berlin entwickelten Instrumentarium zur Beurteilung von Unterricht und Schulen. Dies ist zunÃ¤chst ein Bruch mit der Thematik der bisherigen BeitrÃ¤ge. Die theoretische Fundierung dieser Prozessevaluation lÃ¤sst jedoch die Gemeinsamkeiten deutlich hervortreten und kann auf RÃ¼ckmeldeeffekte von Produktevaluationen Ã¼bertragen werden. Hierzu werden system- und organisationstheoretische Ãœberlegungen aufgegriffen und gezielt auf die Evaluations- und RÃ¼ckmeldeproblematik bezogen: â€žDie Konstruktion von Evaluationsinstrumenten mit dem Ziel der Generierung von Wissen fÃ¼r QualitÃ¤tssicherungsprozesse muss in besonderer Weise die Frage der ResonanzfÃ¤higkeit und Verwendbarkeit von Daten im jeweiligen Organisationskontext berÃ¼cksichtigen" (96).

Das Inventar zur Beurteilung von Unterricht und Schulen (IBUS) wurde dann auch ganz auf die an Schulen vorfindbaren EntscheidungsprÃ¤missen abgestimmt. Gleichzeitig wird ein SchÃ¼lerfragebogen mit Skalen zur UnterrichtsqualitÃ¤t eingesetzt, um die MultiperspektivitÃ¤t zu gewÃ¤hrleisten. Die Anbindung des Instrumentariums an die system- und organisationstheoretischen Vorgaben ist Ã¼berzeugend und konsistent. Thiel und Ulber kÃ¶nnen zeigen, dass diese Basistheorien besonders ertragreich fÃ¼r die Modellierung der innerschulischen Verarbeitung von Ergebnissen aus Evaluationsstudien sein kÃ¶nnen. Das RÃ¼ckmeldeformat der erhobenen Prozessdaten ist ebenfalls durchdacht und den antizipierten BedÃ¼rfnissen des Systems Schule so gut wie mÃ¶glich angepasst worden. Wie die LehrkrÃ¤fte tatsÃ¤chlich reagieren und welche konkreten VerÃ¤nderungen durch die zurÃ¼ckgemeldeten Daten angestoÃŸen werden, bleibt jedoch auch hier verborgen.

Auch Julia Schneewind befasst sich mit der Wirkung von LeistungsrÃ¼ckmeldungen eines auf wenige Schulen begrenzten Forschungsprojektes. Es handelt sich dabei um die an Berliner Grundschulen durchgefÃ¼hrte und lÃ¤ngsschnittlich angelegte Lese-Interventionsstudie BeLesen. In den ersten beiden Schuljahren werden insgesamt sechs Lesetests durchgefÃ¼hrt und differenzierte Ergebnisse an die Schulen und LehrkrÃ¤fte zurÃ¼ckgemeldet. Mit der begleitenden Rezeptionsstudie wird das Ziel verfolgt, die Akzeptanz des Lesetests und die NÃ¼tzlichkeit der Leistungsdaten zu erfassen. Die Ergebnisse entsprechen einer zu erwartenden Motivationslage von LehrkrÃ¤ften, die freiwillig an einer Studie teilnehmen und werden von Schneewind als ermutigend bezeichnet. Es ist jedoch grundsÃ¤tzlich fraglich, inwiefern mit diesen Einstellungsmessungen etwas Ã¼ber den pÃ¤dagogischen Nutzen von LeistungsrÃ¼ckmeldungen gesagt werden kann. Ebenso ist es wohl kaum mÃ¶glich aus der Rezeptionsstudie zu diesem Leseinterventionsprojekt Generalisierungen fÃ¼r die Ã¼bergreifende Fragestellung nach der Wirkung von LeistungsrÃ¼ckmeldungen abzuleiten. Die Teilnahme an einem speziellen und begrenzten Forschungsprojekt hat fÃ¼r LehrkrÃ¤fte einen anderen Stellenwert als verpflichtende, landesweite Lernstandserhebungen.

Im abschlieÃŸenden Beitrag beleuchtet Konstantin BÃ¤hr die Problematik des Umgangs mit Schulleistungsstudien und LeistungsrÃ¼ckmeldungen aus der Perspektive der Bildungsadministration. Unter RÃ¼ckgriff auf akteur- und systemtheoretische PrÃ¤missen entwickelt er die zentrale These: â€žBeim Aufbau neuer und sinnvoller Strukturen fÃ¼r die Verwendung von Daten aus Schulleistungstests (...) muss letztlich die Beobachtung dieser Differenz, also die Beobachtung, dass sich die verschiedenen Akteursgruppen des Bildungswesens an unterschiedlichen Bezugssystemen orientieren, die Ãœberlegungen leiten" (128). Diese These ist mit Sicherheit ein sinnvoller Ausgangspunkt fÃ¼r weiterfÃ¼hrende Analysen und Handlungen, hÃ¤tte aber eine fundierte systemtheoretische BegrÃ¼ndung verdient, wenn dieses TheoriegebÃ¤ude schon angesprochen wird. Thiel und Ulber konnten in ihrem Beitrag bereits die Verwendbarkeit systemtheoretischer Begrifflichkeiten fÃ¼r die Modellierung von LeistungsrÃ¼ckmeldungen unter Beweis stellen.

Nach einer aufschlussreichen Darstellung administrativer Ebenen des Schweizer Schulsystems am Beispiel des Kantons ZÃ¼rich fragt BÃ¤hr nach den spezifischen Bezugssystemen und Codes, die den Akteuren auf den unterschiedlichen Ebenen als Orientierungspunkt dienen. Auch hier wÃ¤re eine genauere Analyse der strukturellen Koppelungen mit Sicherheit lohnenswert, zumal BÃ¤hr ja schon auf die grundlegende Problematik hinweist: â€žWenn Bildungsadministrationen Beobachtungs- und RÃ¼ckmeldesysteme planen, mÃ¼ssen sie davon ausgehen, dass in der Rezeption Sachfragen ... (Schule/Lehrer: Wie gelingt wirksamer Unterricht?) mit Machtfragen (Wer steuert?) verbunden werdenâ€œ (132). Auch die Verwendung unterschiedlicher Codes in der Bildungsverwaltung wird trefflich analysiert: â€žâ€¦ die Verwendung der Bezeichnung Test wird bei Kommunikationen in Richtung Lehrerschaft tunlichst vermieden, so wie sie bei Kommunikationen Richtung Parlament und Ã–ffentlichkeit gesucht wird..." (133).

AbschlieÃŸend legt BÃ¤hr ein Ebenenmodell fÃ¼r die leistungsfÃ¶rdernde Verwendung von Lernstandserhebungen vor. Kernidee dieses Modell ist die gezielte Koppelung bzw. Nicht-Koppelung zwischen verschiedenen Subsystemen. Die zurÃ¼ckgemeldeten Leistungsinformationen sind dabei auf die ZustÃ¤ndigkeit und Handlungskompetenz der jeweiligen Akteursgruppe zugeschnitten. Von besonderer Bedeutung sind Begrenzungen, die bereits in anderen BeitrÃ¤gen dieses Bandes thematisiert wurden und den roten Faden aufgreifen: Die Datenerhebung muss von einer unabhÃ¤ngigen wissenschaftlichen Institution durchgefÃ¼hrt werden und darf zu keiner vergleichenden VerÃ¶ffentlichung fÃ¼hren.

Fazit: Dieser Ã¼berschaubare und gut lesbare Band vermittelt einen Einblick in ausgewÃ¤hlte Studien, die sich mit der Problematik von RÃ¼ckmeldungen im â€žSystem Schuleâ€œ beschÃ¤ftigen. Leistungsvergleichsstudien sind mittlerweile in der bundesdeutschen Bildungslandschaft gut etabliert und werden mit groÃŸem finanziellen Aufwand und wissenschaftlicher Expertise auf allen Ebenen durchgefÃ¼hrt. Der pÃ¤dagogische Nutzen zurÃ¼ckgemeldeter Leistungsdaten fÃ¼r Schulen und Lehrer ist jedoch noch weitgehend unklar und die Erforschung von Rezeption und Umgang mit Evaluationsergebnissen auf Schul- und Unterrichtsebene steckt noch in den Kinderschuhen. Aus diesem Grund sind die von Kuper und Schneewind zusammengestellten BeitrÃ¤ge von Bedeutung. Sie fassen aktuelle Befunde und theoretische sowie methodologische Ãœberlegungen zusammen und kÃ¶nnen zur Weiterarbeit anregen. Zugleich wird auch eine gewisse Marginalisierung bisheriger Studien in diesem Bereich sichtbar, zumal Rezeptionsstudien in der Regel an die Leistungsstudien angehÃ¤ngt und nicht von unabhÃ¤ngigen Forschergruppen durchgefÃ¼hrt werden. Einen ebenso guten Einblick erhÃ¤lt man in die noch nicht ausgereiften theoretischen Modellierungen und die empirischen Vorgehensweisen, mit denen man sich zÃ¶gerlich an den eigentlichen Kern herantastet, den Nachweis tatsÃ¤chlicher VerbesserungsmaÃŸnahmen aufgrund zurÃ¼ckgemeldeter Leistungs- bzw. Evaluationsdaten.

Uwe Maier (SchwÃ¤bisch GmÃ¼nd)

Zur Zitierweise der Rezension:
Uwe Maier: Rezension von: Kuper, Harm / Schneewind, Julia (Hg.): RÃ¼ckmeldung und Rezeption von Forschungsergebnissen. New York, MÃ¼nchen, Berlin: Waxmann 2006. In: EWR 5 (2006), Nr. 4 (Veröffentlicht am 27.07.2006), URL: http://www.klinkhardt.de/ewr/83091640.html