Verlag Julius Klinkhardt: EWR 6 (2007), Nr. 4 (Juli/August 2007): QualitÃ¤tssicherung an Hochschulen

EWR 6 (2007), Nr. 4 (Juli/August 2007)

Sandra Mittag

QualitÃ¤tssicherung an Hochschulen

Eine Untersuchung zu den Folgen der Evaluation von Studium und Lehre

MÃ¼nster: Waxmann 2006

(228 S.; ISBN 3-8309-1713-7; 24,90 EUR)

Die systematische QualitÃ¤tssicherung im europÃ¤ischen Hochschulraum ist ein hochaktuelles politisch initiiertes Thema. So weist Sandra Mittag zu Recht darauf hin, dass im Rahmen des Bologna-Prozesses die Etablierung und der Nachweis von Mindeststandards wichtige Aufgaben der Hochschulen sind. Innerhalb von Deutschland betont die Hochschulrektoren-Konferenz die Bedeutung der QualitÃ¤tssicherung. So sind alle Hochschulen aufgefordert, entsprechende MaÃŸnahmen einzufÃ¼hren. Kritiker Ã¤uÃŸern oftmals, dass Evaluationen nicht zur Verbesserung von Studium und Lehre beitrÃ¼gen, sondern vielmehr weitere, zeitintensive Verwaltungsaufgaben mit sich brÃ¤chten. Das Ziel der nachhaltigen Optimierung von Studium und Lehre stehe dabei im Hintergrund. Die Frage, in welchem AusmaÃŸ Verfahren der QualitÃ¤tssicherung zu positiven langfristigen Verbesserungen fÃ¼hren, blieb bislang unbeantwortet. Sandra Mittag nimmt sich dieser Frage in ihrer Dissertation an und untersucht empirisch, in welchem Umfang ausgesprochene Empfehlungen aus gutachterlichen Stellungnahmen an UniversitÃ¤ten realisiert wurden.

Mittags Ansatz zeichnet sich durch eine starke Anwendungsforschung aus. Das Buch ist in zehn Kapitel unterteilt. In den fÃ¼nf Anfangskapiteln wird, neben der Darstellung der politischen VerÃ¤nderungen im europÃ¤ischen Hochschulraum, eine kurze theoretische Einbindung an die Bildungssoziologie vorgenommen. Daraufhin werden internationale empirische Studien zu Evaluationsverfahren vorgestellt. AnschlieÃŸend werden die Verfahren zweier Evaluationsinstitute dargestellt, auf dessen umfangreiche Daten Mittag zurÃ¼ckgreift. Es folgen ein Methoden- und ein explorativ geprÃ¤gter Auswertungsteil. Die letzten drei Kapitel fassen die Ergebnisse zusammen und es werden OptimierungsvorschlÃ¤ge fÃ¼r die Evaluationspraxis gegeben. Der Aufbau und die wichtigsten Erkenntnisse werden im Folgenden skizziert.

Mittag fasst zunÃ¤chst die Eckdaten der aktuellen Hochschulreform und damit einhergehende QualitÃ¤tssicherungsmaÃŸnahmen zusammen. Es gilt, einen europÃ¤isch vergleichbaren Hochschulraum zu schaffen. QualitÃ¤tssicherung gilt als zentrale MaÃŸnahme, um Standards gewÃ¤hrleisten zu kÃ¶nnen. Dabei unterscheidet Mittag zwischen Evaluationen, die der kontinuierlichen Verbesserung von Studium und Lehre dienen, und Akkreditierung, die eine Sicherung von Mindeststandards gewÃ¤hrleisten sollen.

In der Literatur wird Kritik an den MaÃŸnahmen dahingehend geÃ¤uÃŸert, dass Evaluation der staatlichen Kontrolle diene und der Autonomie der Hochschulen abtrÃ¤glich sei [1]. Als weiterer Kritikpunkt werden die nicht adÃ¤quaten finanziellen und zeitlichen Kosten genannt [2]. Gerade die positiven Folgen von Evaluationen werden angezweifelt. Dies liegt nach Mittag mit an der defizitÃ¤ren Forschungslage zur Wirkung von Evaluationen. Eine hÃ¶here Akzeptanz von Evaluationen kÃ¶nnte insbesondere dann erreicht werden, wenn das Ergebnis und die Wirkung von Evaluationen bekannt seien.

Im zweiten Kapitel wird das mehrstufige Verfahren vorgestellt, mit der internen und externen Evaluation. Mittlerweile haben sich verschiedene Evaluationsinstitute etabliert, die entsprechend den VorschlÃ¤gen der Hochschulrektoren-Konferenz ein mehrstufiges Verfahren anwenden.

Im dritten Kapitel nimmt Mittag wissenschaftliche Konzepte auf, die auf Besonderheiten der Organisation â€žHochschuleâ€œ eingehen und den Nutzen und die Akzeptanz von Evaluationen beeinflussen kÃ¶nnen. Innerhalb von vier Buchseiten wird auf verschiedene Autorinnen und Autoren verweisend [3] die Hochschule als lernende Organisation beschrieben. Es werden hierbei zwei Lernebenen unterschieden [4]: Zum einen das â€žsingle loop learningâ€œ, das eine einfache VerhaltensverÃ¤nderung mit sich bringt, und zum anderen das â€ždouble loop learningâ€œ, das auf die langfristige VerÃ¤nderung von Werten abzielt. Im anschlieÃŸenden Abschnitt wird Hochschule als â€žlose Disziplinenverkopplungâ€œ mit â€žstarken dezentralen Einheitenâ€œ verstanden, in der Hochschullehrerinnen ein hohes MaÃŸ an Autonomie besitzen (17). Entsprechend lehnen Wissenschaftler eher externe Kontrolle ab. Um ReformmaÃŸnahmen in einer solchen Organisation umsetzen zu kÃ¶nnen, werden Managementsysteme implementiert. Evaluationen kÃ¶nnen hierbei eine â€žvermittelnde Funktionâ€œ einnehmen, die das Lernen unterstÃ¼tzt (19). Warum Hochschule als eine â€žlernende Organisationâ€œ bezeichnet wird, wird in der Argumentation nicht ganz deutlich. Hochschulen erscheinen mir eher autonom und â€ždezentralâ€œ organisiert â€“ wie Mittag selbst bemerkt â€“ und somit vielmehr als â€šlernresistentâ€™.

Im vierten Kapitel werden Studien aus mehreren europÃ¤ischen LÃ¤ndern vorgestellt, die teilweise international und teilweise national ausgerichtet waren. Mittag fasst die Ergebnisse zusammen: Die ausschlieÃŸliche Erstellung eines Gutachtens hat in der Regel lediglich eine â€žBelohnungâ€œ (48) von einzelnen Aspekten zur Folge; die VerÃ¤nderung von Strukturen erfolgt erst bei einer konzeptionellen Einbindung in ein QualitÃ¤tsmanagement. Es lieÃŸ sich in einigen FÃ¤llen eine gestiegene Akzeptanz gegenÃ¼ber Evaluationen nachweisen, wenn ein QualitÃ¤tskonzept vorhanden war. Eine weitere Erkenntnis aus den Studien ist, dass eine Einbindung der Betroffenen in das Verfahren einen hÃ¶heren Abbau von aufgezeigten SchwÃ¤chen nach sich zieht.

Mittag hat den Anspruch, erstmalig fÃ¼r Deutschland den Anteil an Umsetzungen von geforderten MaÃŸnahmen zu bestimmen. Dazu greift sie auf die Daten der zwei Ã¤ltesten Evaluationseinrichtungen (Zentrale Evaluations- und Akkreditierungsagentur Hannover; Verbund Norddeutscher UniversitÃ¤ten) zurÃ¼ck. Beide Einrichtungen verwenden vergleichbare LeitfÃ¤den: Dabei werden vielfÃ¤ltige Punkte der Organisation, Ausstattung sowie Profil von Studium und Lehre erhoben. Aber auch weitergehende Aspekte, wie FÃ¶rderung des wissenschaftlichen Nachwuchses und der Absolventenverbleib sollen im Selbstreport geschildert werden.

Im Methodenteil werden nachvollziehbar die verwendeten quantitativen Verfahren und qualitativen Auswertungen erlÃ¤utert. Das aufwendige, detaillierte Vorgehen wird deutlich: Zwei Kodierer analysierten sÃ¤mtliche Gutachten (bis zum Jahr 2003) der Evaluationseinrichtungen und die dazugehÃ¶rige Stellungnahme der Hochschulen (117 Gutachten). Somit kann eine GegenÃ¼berstellung von Forderungen der GutachterInnen mit den Umsetzungs- und RealisierungsmaÃŸnahmen der UniversitÃ¤t vorgenommen werden. Zudem wurden Beteiligte zur Zufriedenheit mit dem Vorgehen bei der Evaluation sowohl schriftlich (492 Personen) als auch in Interviews (33 Personen) befragt. Um Fachgebiete vergleichen zu kÃ¶nnen, werden die Disziplinen in fÃ¼nf Kategorien geordnet. Mittag wÃ¤hlt differenziert je nach Datenlage entsprechende quantitative statistische Methoden aus und berichtet neben Signifikanzen auch immer Ã¼ber EffektstÃ¤rken. Das Berichten von EffektstÃ¤rken ist besonders positiv hervorzuheben, da dies immer wieder gefordert, aber kaum umgesetzt wird [5]. Da alle vorhandenen Evaluationsverfahren berÃ¼cksichtigt wurden, kann von einer Vollerhebung ausgegangen werden â€“ genau genommen wÃ¤ren keine SignifikanzprÃ¼fungen notwendig.

Zu Beginn des siebten Kapitels formuliert Mittag explorative Untersuchungsfragen. Die Autorin will der Frage nachgehen, in welchem AusmaÃŸ Empfehlungen, die von Gutachtern ausgesprochen wurden, umgesetzt werden. Zudem ist von Interesse, ob weitergehende qualitÃ¤tssichernde MaÃŸnahmen, die nicht im Gutachten festgehalten werden, durch den Evaluationsprozess ausgelÃ¶st wurden und ob bestimmte Kritikpunkte hÃ¤ufiger umgesetzt werden als andere. Weiterhin werden GrÃ¼nde fÃ¼r Erfolg und Misserfolg der Umsetzung diskutiert. Eine dritte Hauptfrage beschÃ¤ftigt sich mit den OptimierungsmÃ¶glichkeiten von Evaluation. All diese auswertungsleitenden Fragen weisen keine Richtung oder konkreten Hypothesen auf.

Die Ergebnisse zeigen, dass 56% aller OptimierungsmÃ¶glichkeiten, die in den Gutachten festgestellt wurden, umgesetzt oder in Bearbeitung sind. Dagegen wurden bei 29% der gutachterlichen Hinweise ohne weitere Angaben keinerlei MaÃŸnahmen eingeleitet. Eine ErklÃ¤rung, warum einige Aspekte nicht umgesetzt wurden, wird bei 15% der FÃ¤lle genannt. Neben den von den EvaluatorInnen genannten Punkten, wurden in einigen FÃ¤llen eigene VerbesserungswÃ¼nsche von UniversitÃ¤tsangehÃ¶rigen festgehalten. Von diesen selbstentwickelten Zielen wurden 80% umgesetzt.

Der Fachgruppenvergleich zeigt, dass der Umsetzungsumfang in den Ingenieurwissenschaften (62%) sowie in den Rechts-, Wirtschafts- und Sozialwissenschaften (61%) am hÃ¶chsten ist, wÃ¤hrend er bei den Sprach- und Kulturwissenschaften (49%) am geringsten ausfÃ¤llt. Untersuchungen aus GroÃŸbritannien (Brennan et al.) zeigen abweichende Ergebnisse: Dort wurden besonders viele MaÃŸnahmen im Fachgebiet Informatik, und besonders wenig im Studiengang Geowissenschaften umgesetzt. Brennan et al. kategorisiert die Fachrichtungen nicht. Fraglich ist der Gewinn dieses Fachvergleichs. Die Kategorisierung von Fachrichtungen nimmt Mittag gemÃ¤ÃŸ statistischem Bundesamt vor. FÃ¼r Forschungszwecke erscheint mir das Vorgehen weniger Ã¼berzeugend. Die Gruppen dÃ¼rften zu heterogen sein und infolgedessen empirische Unterschiede kaum inhaltlich interpretierbar sein. Mittag stellt selbst keine Hypothesen zu den Unterschieden in den Fachgruppen auf, die die gefundenen Ergebnisse erlÃ¤utern wÃ¼rden. In der spÃ¤teren Diskussion wird lediglich auf die geringeren finanziellen MÃ¶glichkeiten der Geisteswissenschaften hingewiesen.

Als weiteres Ergebnis wird ein generelles Defizit an Hochschulen festgestellt: Es liegt eine unzureichende FÃ¶rderung des wissenschaftlichen Nachwuchses vor. Im Bereich der NachwuchsfÃ¶rderung werden lediglich 42% der in Gutachten genannten Forderungen umgesetzt.

Interessante Anhaltspunkte liefern die Interviews mit UniversitÃ¤tsangehÃ¶rigen, warum MaÃŸnahmen nicht umgesetzt werden. Neben dem bekannten und zu erwartenden Argument der finanziellen EngpÃ¤sse konnte eine kritische Haltung gegenÃ¼ber Evaluationen sowie mangelndes Engagement als Hindernis fÃ¼r VerÃ¤nderungen identifiziert werden. So hÃ¤lt Mittag fest, dass eine Evaluation nur dann zur QualitÃ¤tsentwicklung an einer UniversitÃ¤t beitragen kann, wenn das Professorium untereinander produktiv kommunizieren kann und ein Interesse an der Optimierung von Studium und Lehre aufweist.

Ein weiterer meines Erachtens wichtiger Vergleich ist der zwischen dem Anteil umgesetzter MaÃŸnahmen, festgestellt durch die Inhaltsanalyse der Autorin auf der einen Seite, und der subjektiven EinschÃ¤tzung des Verfahrens durch die schriftliche Befragung von UniversitÃ¤tsangehÃ¶rigen auf der anderen Seite. Es zeigt sich durchgehend, dass in Hochschulen, in denen das VerhÃ¤ltnis von Aufwand und Nutzen als angebracht bezeichnet, sowie die QualitÃ¤tssicherung als wichtig erachtet wird, deutlich mehr UmsetzungsaktivitÃ¤ten vorzufinden sind. In Gutachten festgestellte SchwÃ¤chen werden folglich an UniversitÃ¤ten hÃ¤ufiger verbessert, an denen eine positive Einstellung gegenÃ¼ber Evaluationen herrscht. Die Autorin verweist zu Recht auf die nicht eindeutige Wirkrichtung, allerdings ist der reine Zusammenhang an sich berichtenswert.

In der Diskussion nimmt Mittag die eingefÃ¼hrten Konzepte des â€žsingleâ€œ und â€ždouble loop learningsâ€œ wieder auf. Sie resÃ¼miert ihre Ergebnisse dahingehend, dass â€žvor allem ein single loop learning stattgefundenâ€œ hat, da die Gesichtspunkte der Gutachten â€žin konkrete MaÃŸnahmen gemÃ¼ndetâ€œ sind (127). Konkrete VerÃ¤nderungen sind einfacher nachweisbar als WerteverÃ¤nderungen, gerade bei dem gewÃ¤hlten Verfahren der Autorin. Mittag wertete die Gutachten dahingehend aus, wie viele der in Evaluationsgutachten genannten SchwÃ¤chen bearbeitet werden. Entsprechend sind vorgenommene VerÃ¤nderungen Ergebnis einer solchen Untersuchung. Allerdings weist die Arbeit nicht nur eine instrumentelle Verwendung der Evaluation (single loop), sondern auch eine konzeptionelle VerÃ¤nderung der â€žQualitÃ¤tskulturâ€œ (133) nach. Insbesondere die Interviews zeigen die Steigerung der Kommunikation an Hochschulen: â€žEs wird versucht, anhand [â€¦] der Gutachten [â€¦] ins GesprÃ¤ch zu kommenâ€œ (111). Das â€ždouble loop learningâ€œ ist allerdings deutlich schwieriger festzustellen und nicht Ziel der vorliegenden Auswertungen gewesen.

Mittag schlieÃŸt ihre Dissertationsschrift mit VorschlÃ¤gen zur Weiterentwicklung von mehrstufigen Evaluationsverfahren ab. In Zukunft sollten vermehrt sowohl von Gutachterseite als auch von HochschulangehÃ¶rigen auf die NachwuchsfÃ¶rderung geachtet werden. Die Wichtigkeit dieses Standpunktes wird mit dem Hinweis auf die aktuelle Exzellenzinitiative unterstrichen, da dort die Bildung von Doktoranden-Colloquia in Deutschland forciert wird. Zudem sollten insbesondere in den Inhaltsbereichen, in denen weniger Optimierungen vorgenommen wurden, konkretere HandlungsvorschlÃ¤ge in den Gutachten formuliert werden. Ein weiterfÃ¼hrender Gedanke ist die Idee, den HochschulangehÃ¶rigen einen Austausch mit den Gutachtern zu ermÃ¶glichen. Manche HochschulangehÃ¶rige bemÃ¤ngelten, keine ErklÃ¤rung zu aufgezeigten â€šSchwÃ¤chenâ€™ geben zu kÃ¶nnen.

Der Gedanke, dass Evaluationen mit einer Kultur der QualitÃ¤tssicherung zu verbinden seien, um langfristige und anhaltende Verbesserungen zu erzielen, kann sicherlich nur von allen Wissenschaftlerinnen in diesem Forschungsbereich unterstÃ¼tzt werden. Sandra Mittag legt mit ihrer Dissertation erste wichtige Einblicke in die UmsetzungsrealitÃ¤t von Evaluationsergebnissen vor. Das Buch zeichnet sich durch multimethodale Vielfalt aus und verbindet quantitative mit qualitativen Daten in einer sinnvollen und sich ergÃ¤nzenden Weise. Die Ergebnisse sind gerade fÃ¼r HochschulangehÃ¶rige interessant, die mit Evaluationen betraut sind. Der Ablauf von Evaluationen wird erlÃ¤utert. Die Erwartung, was das Ergebnis von Evaluationen sein kann, sollte sich an den dargestellten Zielen orientieren. Was mit Evaluationen an Hochschulen realistischerweise bewirkt werden kann, wird von Mittag erstmalig systematisch aufgezeigt. Mehrstufige Evaluationen bewirken eine ganze Reihe von Verbesserungen von Studium und Lehre; denn es werden immerhin 56% aller im Evaluationsbericht vorgeschlagener Optimierungshinweise bearbeitet. Die Kenntnis dieses Ergebnisses fÃ¼hrt hoffentlich bei HochschulangehÃ¶rigen zu einer hÃ¶heren Akzeptanz von Evaluationen, und die BefÃ¼rchtung, es sei nur ein zeitlicher Aufwand damit verbunden, kann als widerlegt gelten.

FÃ¼r die science community entstehen Anhaltspunkte darÃ¼ber, wie viel von mehrstufigen Evaluationsverfahren umgesetzt wird, und dass erwartungsgemÃ¤ÃŸ die Akzeptanz von Evaluationen einen groÃŸen Einfluss auf das Verfahren nimmt. Einzelne Forschungsfragen, beispielsweise warum bestimmte Aspekte eher umgesetzt werden als andere, entstehen durch die LektÃ¼re des Buches. Ich bin mir sicher, dass Mittag selbst einige weitere Forschungsfragen beantworten wird.

[1] Altrichter, H., Schratz, M. & Pechar, H. (1997): Hochschulen auf dem PrÃ¼fstand. Was bringt Evaluation fÃ¼r die Entwicklung von UniversitÃ¤ten und Fachhochschulen? (Studien zu Bildungsforschung & Bildungspolitik, 16). Innsbruck: Studien-Verlag.
Harvey, L. & Askling, B. (2003): Qualitity in Higher Education. In: R. Begg (Hrsg.): The Dialogue Between Higher Education Research and Practice. Dordrecht: Kluwer, 69-83.
[2] Webler, W. D. (1996): QualitÃ¤tssicherung in Fachbereichen â€“ ein erster Modellvergleich. In: Das Hochschulwesen, 44, 16-27.
Schimank, U. (2005): Politikberatung als Verrat. Leistungsbeurteilung von Kollegen am Beispiel von Evaluationen im Hochschulsystem. In: Forschung & Lehre, 2, 76-79.
[3] Boyce, M. E. (2003): Organizational Learning Is Essential to Achieving and Sustaining Change in Higher Education. In: Innovative Higher Education, 28, 119-136.
Harvey, L. & Askling, B. (2003): Qualitity in Higher Education. In: R. Begg (Hrsg.): The Dialogue Between Higher Education Research and Practice. Dordrecht: Kluwer, 69-83.
Pellert, A. (1999): Die UniversitÃ¤t als Organisation. Die Kunst, Experten zu managen (Studien zu Politik und Verwaltung, 67). Wien: BÃ¶hlau.
[4] Argyris, C. & SchÃ¶n, D. A. (2002): Die lernende Organisation. Grundlagen, Methoden, Praxis. Stuttgart: Klett-Cotta.
[5] Cohen, J. (1994): The earth is round. (p<.05). In: American Psychologist, 49, 997-1003.

Edith Braun (Berlin)

Zur Zitierweise der Rezension:
Edith Braun: Rezension von: Mittag, Sandra: QualitÃ¤tssicherung an Hochschulen, Eine Untersuchung zu den Folgen der Evaluation von Studium und Lehre. MÃ¼nster: Waxmann 2006. In: EWR 6 (2007), Nr. 4 (Veröffentlicht am 26.07.2007), URL: http://www.klinkhardt.de/ewr/83091713.html