Logo
Unterrichten

6.1.6 Leisten

Leistung erfassen und bewerten - Standards

- Hinweise &. Ergänzungen -

Messen_logo

KB_leisten_stand

1. Problemaufriss

Die international zu beobachtende Tendenz, im Bildungswesen nationale Standards auszuweisen oder gar sich an Standards auf internationale Ebene ( z.B. in Sprachen in Europa) zu orientieren, hat Auswirkungen auf unsere Schulen, die sich langsam abzuzeichnen beginnen. Der Wettbewerb der Nationen um die besten Köpfe geht ankeiner einzelnen Schule mehr vorbei.
PiSA und die daraus folgendenm bildungspolitische Aktivitäten können als Vorbote dieser Entwicklung aufgefasst werden. Neben der Vereinbarung in einem regelmäßigen Turnus weiter an OECD- Studien mitzuwirken, vereinbarte die KMK auf nationaler Ebene bereits Standards für den "Mittleren Bildungsabschluss". Ab 2009 sind weiterhin regelmäßige nationale Tests vereinbart.

Standardisierung und Evaluation sind also Prozesse, die Sie in Ihrem Berufsleben bekleiden werden.

nach oben

2. Ein Blick über den Gartenzaun: USA

Die USA dürfte wohl eines der Länder sein sein, bei dem die Standardisierung und die damit verbundenen Leistungsüberprüfungssysteme an Schulen am weitesten ausgebaut sind. Wenn wir die amerikanische Diskussion verfolgen, können wir uns u.U. manchen Irrweg ersparen.

In der Literatur finden wir z.B. bei M. Russell zur Grundproplematik jeder Leistungsüberprüfung:

Egal ob wir uns auf Tests, Ausstellungen , Einzelüberprüfung, Portfolio, oder einen Vortrag (Präsentation) konzentrieren, die Prüfungsmethoden sind immer die gleichen: Aus einem speziellen Wissensgebiet wird eine Stichprobe einzelner Verhaltensweisen gewählt, die Vorhersagen über den möglichen Lernerfolg auf diesem Gebiet ermöglichen sollen. Obwohl Schüler, Eltern, Lehrer und die Öffentlichkeit wie gebannt auf die erreichten Punktwerte starren, ist nicht der erzielte Rang (Punktwert) von Interesse, vielmehr sollte es die praktische Darstellung/Vorstellung des Lernenden (Performanz) auf dem gewählten Fachgebiet sein.

Beispiel: Wir geben einem Drittklässler einen Mathematiktest, der überprüft, wie gut der Schüler die Fertigkeiten und Fähigkeiten, die er im Verlauf der dritten Klasse erworben hat, auf dementsprechende Problemlösungen anwendendet. Da es unmöglich ist, alle möglichen Problemstellungen, die diese Fähigkeiten und Fertigkeiten erfordern, anzubieten, wird nur eine begrenzte Auswahl im Test vorhanden sein.

n. Michael Russell S.22

Aus der Bewältigung dieser Stichprobe erschließen wir, wie gut der Schüler in der Lage ist, seine Drittklässlerfähigkeiten auf alle möglichen Problemlösung anzuwenden.

Nach Russell (a.a. O. S.22f.) lassen sich bei Leistungsüberprüfungen folgende vier Grundprinzipien erkennen:

  1. Ein Schüler gibt mündlich oder schriftlich Antworten auf mehrere Fragen.
  2. Ein Schüler soll ein Produkt herstellen (Experiment vorführen, ein Modell bauen, ...).
  3. Ein Schüler führt etwas vor ( Musikinstrument spielen, Theaterstück spielen, Vorturnen, Präsentieren, ....)
  4. Der Schüler/ die Schülerin wird mit Frage- oder Problemstellungen konfrontiert und wählt zur Beantwortung aus vorgegebenen Formulierungen aus.

Während bei den ersten 3 Möglichkeiten durch vorher definierte Kriterien von Lehrern beurteilt wird, ob das Ziel erreicht wurde, kann bei der vierten Verfahrensweise auch von einem Computer festgestellt werden, ob die richtige Auswahl getroffen wurden. Damit ist auch leicht erkennbar, welcher "Punktwert" (kriteriumsorientiert) erreicht wurde. Rangordnungen sind mit der vierten Methode sehr leicht zu erstellen.

Wenn wir die bildungspolitische Situation bei uns betrachten, kann die Einführung nationaler Standards auch bedeuten, dass durch staatlich (bzw. durch die OECD) vorgegebene Tests, ähnliche Problemstellungen, wie in den USA auftreten. Dies sind nach Russell u.a.:

  • Testet der Staat (Land, OECD) bzw. die Lehrkraft die Schüler ?
  • Sind die Tests norm- oder kriterienorientiert?
  • Welche Fächer/ Sachgebiete müssen getestet werden, damit den Schülern Schulerfolg bescheinigt werden kann?
  • Welche Art von Testitems ( multiple choice, Portfolio, Präsentationen, ...) wird benutzt?
  • In welchem Umfang orientieren sich die Arbeiten an Landes- bzw. Bundesstandards?
  • Führen die Ergebnisse solcher Tests zu einer Bewertung der Schulen (ranking)?
  • Wie reagiert die Schulverwaltung auf "Nicht-; Mindererfüllung von Standards?"
    Gibt es Sanktionen oder Unterstützung?

nach oben

Kritik an Praxis des Testens

In dieser - bei uns - doch noch stark ungeklärten Situation regt sich ein natürlicher Widerstand gegen Standards als benchmarking, als Beispiel von best practice. Die relativ eindeutig ausgerichteten multiple choise - Testverfahren (überwiegend in den USA ), - so die Kritiker auch in den USA - würden die höheren kognitiven Anforderungen und Entwicklungsstufen des Schülers nicht abbilden. Dem sind Überprüfungsverfahren entgegenzusetzen, die an Alltagsproblemen auszurichten seien.

a. Komplexe offene Aufgabenstellung

Komplexe - offene Aufgaben mit mehreren möglichen Aufgabenlösungen, Interpretation von Diagrammen (z.B. Pisa), Tests in denen der Schüler die geforderte Leistung auch tatsächlich erbringen muss (z.B. Experimentiertests), Portfolios und Ausstellungen würden dies viel eher überprüfen. Die wichtigen Kommunikations- und Kombinationsfähigkeiten sind damit auch besser zu erfassen.

Beispiele:

In Mathematik enthält solch ein Test offene Aufgaben (Problemstellungen), die vom Schüler komplexe Problemlösungsstrategien verlangen, wie sie etwa im Alltag auftreten könnten.
In Deutsch wäre die Verfassung eines längeren Textes notwendig, nachdem genügend Zeit für Brainstorming, zur Sammlung von Material, Verarbeitung der Informationen zur Verfügung gestellt wurde.

b. Präsentationen

In den USA gibt es aber auch Schulen (Coalition of Essential Schools), in deren Schulcurriculum festgelegt wird, welche "Grundfertigkeiten/ -fähigkeiten" ein Schüler haben sollte. Zur Überprüfung des Schülerverständnisses setzen diese Schulen Ausstellungen und Präsentationen vor einer größeren Zuhörerschaft ein. Als Nachteil dieses Verfahrens wird der große Zeitaufwand beschrieben. Außerdem ist eine totale Umstrukturierung des Schulbetriebs nötig.

c. Performanztests

Weil es einen großen Unterschied zwischen der Tatsache macht, ob ich das Wissen über Fakten in einem Fachgebiet widergeben oder ob ich das Wissen anwenden und damit Probleme lösen kann, sind Performanztest (in den USA seit 1992, ähnliche Aufgaben sind in TIMSS, bzw. Pisa allerdings nur in "Papier und Bleistift-Form" zu finden) in Gebrauch.

Beispiel:

In Performanztests setzen sich die Schüler mit einer Problemstellung auseinander. Mit der Hilfe von Material und Ausrüstung bzw. mit einigen knappen Fragestellungen, werden Hilfen zur Bearbeitung angeboten.
Bei Auswertung des Prozesses, der Ergebnisse in einer Präsentation geben die Schüler auch Rechenschaft über ihre Lösungsstrategie.

Wie bei den oben beschriebenen Präsentationen sind die Erfahrungen positiv, doch wird auch eingeräumt, das der zeitlicher Umfang erheblich, die Auswertung kompliziert, die Punktebewertung schwierig ist.

d. Portfolioarbeit

Als weitere Methode der Leistungsbewertung wurde seit 1990 in den USA mit Portfolios gearbeitet. Als Antriebsfeder diente nach Russell

  1. die Tatsache, dass Schüler am Testtag oft nicht ihre beste Leistung erbringen,
  2. dass jeder Test nur einen Bruchteil des Umfangs des Wissens umfasst, zu dem ein Schüler potentiell in der Lage ist.

Portfolios dienen der Zusammenstellung der best practice. Außerdem können mit seiner Hilfe Lernprozesse im zeitlichen Ablauf des Schuljahres erfasst werden.

Hohe Kosten - vor allem als zeitliche Aufwendung der Lehrkraft berechnet - und geringe Reliabilität führten dazu, dass Portfolios in den USA in keinem staatlichen Testprogramm mehr zu finden sind.

e. Diagnostische Tests

Aus dem Bestreben heraus, Schüler beim Lernen zu unterstützen, wurden seit 1980 diagnostische Verfahren eingeführt. Diese Tests sollten den Lehrern praktische Informationen für ihre Arbeit liefern, statistische Aussagen waren eher nebensächlich. Nach Russell scheiterte das Projekt an der Akzeptanz durch Verwaltung und Lehrkräften.

Heutiger Stand

Es sei aber auch hier noch kritisch zu vermerken, dass in den USA der Testmarkt (Hardware, Software, Dienstleistung) für Firmen sehr interessant ist. Von Seiten der Verwaltung werden natürlich Tests zu bevorzugen, bei denen Firmen möglichst wenig Zeit für die Auswertung benötigen. Mutiple-choice bzw. Tests an Computern entsprechen diesem Ideal am ehesten.

 

 

nach oben

Literatur:

Russell, Michael (2006): Technology and Assessment - The Tale of two Interpretations. A Volume in Research Methods for Educational Technolgy. IAP