Schon gelesen?! – Universität Klagenfurt

Nikola Dobrić/Hermann Cesnik/Claudia Harsch (eds.): Festschrift in honour of Günther Sigott: advanced methods in language testing. Peter Lang, 2023.

Zu finden in der Leseecke

Dieser Band, der im deutschsprachigen Raum traditionell als Festschrift bezeichnet wird, wurde zusammengestellt, um Günther Sigott für seine bemerkenswerten Beiträge zur Wissenschaft im Allgemeinen und zum Bereich des Sprachtestens im Besonderen zu ehren. Sie umfasst neun internationale Beiträge, die im weiteren Bereich der Sprachtests und -bewertung angesiedelt sind. Zu den Themen gehören insbesondere Validität und Validierung, Normen und Standards, Testdesign, Testkalibrierung und die neuesten Fortschritte in der Psychometrie.

Ein Exemplar des empfohlenen Werkes befindet sich in der Leseecke (11) mit der Signatur I 647860.

Der vorliegende Band, der im deutschsprachigen Raum traditionell als Festschrift bezeichnet wird, wurde zusammengestellt, um Günther Sigott für seine bemerkenswerten Beiträge zur Wissenschaft im Allgemeinen und zum Bereich des Sprachtestens im Besonderen zu ehren. Es ist nicht übertrieben zu sagen, dass Günther Sigott eine der Schlüsselfiguren war, die Sprachtests und -bewertung in Österreich auf die akademische Landkarte gebracht haben. Seine Arbeit im Rahmen der nationalen Teststandards und die Art und Weise, wie diese Arbeit die Bedeutung von Sprachtests auch in der Öffentlichkeit vermittelte, trugen dazu bei, die Relevanz der Disziplin zu festigen. In dieser Hinsicht ebnete Günther den Weg für viele von uns, die als SprachprüfungswissenschaftlerInnen in Österreich arbeiten, zu einer Zeit, als Sprachprüfung noch nicht als wissenschaftliches Gebiet außerhalb der englischsprachigen Welt etabliert war.

Die Autorinnen und Autoren dieses Bandes kommen aus allen Teilen der Welt, von Österreich und seinen Nachbarländern Slowenien und Deutschland über Großbritannien, die USA und Kanada bis hin zu Japan und dem Iran. Sie arbeiten als Testentwickler, Lehrerausbilder, Psychometriker und Forscher und befassen sich mit einer Vielzahl von Themen, wie z. B. dem Washback von standardisierten Tests, der Anerkennung von Sprachvarietäten in hochrangigen Prüfungen, der Förderung von Sprachbewertungskompetenz und psychometrischen Modellen zur Verbesserung der Interpretation von C-Tests oder der Validität von Bewertungen.
Das Buch beginnt mit einer vielbeachteten integrativen Betrachtung der Validität, die verschiedene Denkschulen und divergierende Traditionen aus dem Vereinigten Königreich und den USA zusammenführt. Es wirft einen vielversprechenden Blick auf die Validität, die ihrer Ansicht nach vier Dimensionen umfassen muss, nämlich Testentwicklung, Messtheorien, Konsequenzen und Kommunikation mit allen Beteiligten. Der nächste Beitrag skizziert ein Argument dafür, Testaufgaben aus einem groß angelegten standardisierten Test, der für das Bildungsmonitoring verwendet wird, in den Sprachunterricht zu bringen. Auf diese Weise sollen Kommunikationskanäle zwischen Testentwicklern auf der einen und Lehrern und Lernenden auf der anderen Seite geöffnet werden. Der Schwerpunkt liegt darauf, Leseaufgaben so einzusetzen, dass sie die Lesefähigkeit fördern, anstatt sie „nur“ zu messen.

Das dritte Kapitel befasst sich mit der Frage, was erforderlich ist, um bei angehenden Lehrkräften die Kompetenz zur Bewertung von Sprachkenntnissen (LAL) zu entwickeln – eine Voraussetzung dafür, dass künftige Lehrkräfte Tests und Bewertungen in ihrem Unterricht sinnvoll entwickeln, einsetzen und interpretieren können. Im Mittelpunkt steht eine Umfrage, die durchgeführt wurde, um herauszufinden, wie anspruchsvoll die verschiedenen bekannten Komponenten von LAL von angehenden Lehrkräften wahrgenommen werden. Der anschließende Beitrag befasst sich mit einem anspruchsvollen Sprachtest am Ende der Sekundarstufe, der in Slowenien auch das Recht auf Zugang zur Universität beinhaltet. Er konzentriert sich auf die Sprachrichtigkeit als eine Teilkomponente der Sprachkenntnisse und untersucht ihre Beziehung zu anderen Teilen der Prüfung. Die Ergebnisse zeigen, dass die Sprachrichtigkeit zwar mäßig bis stark mit dem Leseteil korreliert, aber dennoch ihren eigenen Platz in der Prüfung hat, da nur mäßige Korrelationen zwischen den verschiedenen Testteilen, die auf die Sprachrichtigkeit abzielen, gefunden wurden.

In Kapitel fünf wird eine weitere Prüfung mit hohem Niveau vorgestellt, dieses Mal in Österreich, das Österreichische Sprachdiplom Deutsch (ÖSD). Es wird die wichtige Dimension der Plurizentrik erörtert, eine Perspektive, der das ÖSD Rechnung trägt, indem es alle drei Sprachvarietäten der deutschen Sprache, die in Österreich, Deutschland und der Schweiz gesprochen werden, einbezieht. Es wird dargelegt, wie der plurizentrische Ansatz des ÖSD begründet wird, wie er operationalisiert wird und wie er in den Prüfungen des ÖSD umgesetzt wird. Das sechste Kapitel, das beim ÖSD verbleibt, befasst sich mit einem eher technischen Aspekt der Testkalibrierung, der auch als Beitrag zur Validität des ÖSD aus messtechnischer Sicht verstanden werden kann. Es wird auf die Bemühungen eingegangen, verschiedene Prüfungsversionen innerhalb des ÖSD über einen gemeinsamen Ankertest zu kalibrieren, um Testversionen mit demselben Schwierigkeitsgrad zu erhalten und so die Vergleichbarkeit zwischen verschiedenen Testsitzungen zu gewährleisten.

Die übrigen drei Kapitel der Festschrift befassen sich mit messtechnischen Aspekten. Zunächst wird in Kapitel sieben ein neuer Ansatz zur Modellierung lokaler Abhängigkeiten in C-Tests vorgestellt, eine bekannte Herausforderung für C-Test-Forscher und -Nutzer. Dieser alternative Ansatz identifiziert zunächst Aufgaben mit solchen Abhängigkeiten und bündelt in einem nächsten Schritt nur die Aufgaben mit bekannten Abhängigkeiten; im letzten Schritt werden die gebündelten Aufgaben zusammen mit denjenigen, die keine lokalen Abhängigkeiten aufwiesen, auf einer Schwierigkeitsskala zusammengefasst. Zweitens wird in Kapitel acht eine innovative Methode vorgestellt, die nur einige wenige Maße umfasst, die mit Hilfe bestehender automatisierter Indizes leicht erhoben werden können, um die Schwierigkeit von C-Testaufgaben und Texten mit angemessener Genauigkeit zu schätzen. Auch wenn die Ergebnisse immer noch Schwankungen in der Vorhersagegenauigkeit aufweisen, ist die vorgeschlagene Methode insofern vielversprechend, als sie dazu beitragen könnte, bei der Vorabtestung von C-Tests erhebliche Ressourcen einzusparen. Das abschließende Kapitel enthält einen sehr kompetent zusammengestellten Überblick über die neuesten Fortschritte in der Many-Faceted Rasch (MFRM)-Modellierung, und zwar in einer Weise, die nicht nur für Messungsexperten aufschlussreich, sondern auch für Laien zugänglich ist, die sich einen ersten Überblick über MFRM verschaffen wollen.