Wie kann man Schreiben beurteilen? – Universität Klagenfurt

Günther Sigott und Hermann Cesnik haben kürzlich die Ergebnisse einer Studie zur Stabilität von Skalendeskriptoren im Bewertungsraster für die österreichische Matura aus Deutsch vorgestellt. Der Artikel ist im kürzlich gegründeten Open-Access-Journal „Colloquium: New Philologies“ erschienen.

Schreibleistungen können mit Skalen oder Beurteilungsrastern bewertet werden. Charakteristisch für die Verwendung von Skalen ist, dass nicht etwa Fehler gezählt werden, sondern vielmehr versucht wird, den Gesamteindruck, der in der beurteilenden Person erweckt wird, einer Niveaustufe auf einer mehrstufigen Skala zuzuordnen. „Es geht also um einen qualitativen Beschreibungsansatz“, so Studienautor Günther Sigott (Institut für Anglistik & Amerikanistik). Anders als in Testverfahren spiele bei der direkten Beurteilung von sprachlichen Leistungen mittels Skalen die Interpretation der Skalen und der darin enthaltenen Formulierungen eine wesentliche Rolle. Man müsse sich also fragen: Wie interpretiert der oder die Beurteilende die Beschreibungen auf der Skala?

Für die in Österreich kürzlich eingeführte Zentralmatura wurden entsprechende Skalendeskriptoren im Bewertungsraster entwickelt. Günther Sigott und Hermann Cesnik haben sich für ihre Studie nun gefragt, inwiefern dieser Beurteilungsprozess „stabil“ ist, also möglichst viele Beurteilende zu denselben Interpretationen und Bewertungen kommen. An der Studie nahmen 117 noch nicht für diese Bewertungsform geschulte Lehrkräfte verschiedener Schultypen aus ganz Österreich teil. „Die Ergebnisse zeigen, dass die Schulung der Beurteilenden zur Erhöhung der Übereinstimmung unumgänglich ist. Eine Verwendung der Skala durch nicht Geschulte ist nicht ratsam“, fasst Günther Sigott zusammen. Einzelne Beschreibungen bei Niveaustufen, so genannte Deskriptoren, stellten sich als wenig stabil heraus, was für Sigott eine Überarbeitung des Beurteilungsrasters in diesen Bereichen nötig macht, die derzeit im Gang ist. Interessant ist, dass die Interpretationen beim untersten Leistungsniveau am meisten variabel waren. Hingegen konnten die Forscher feststellen, dass „es ein hohes Maß an Konsens über die erwarteten Charakteristika von exzellenter Leistung zu geben scheint“. Beim höchsten Niveau wurden die Beschreibungen der einzelnen Leistungsbereiche also am einheitlichsten von den Beurteilenden interpretiert.

Der Beitrag wurde in der ersten Ausgabe des Ende Jänner vorgestellten Open-Access-Journals „Colloquium: New Philologies“ vorgestellt. Den Text finden Sie unter http://colloquium.aau.at.