Diagnostische Methoden IV: Schulleistungstests (Testbeispiele. Kennen lernen unterschiedlicher schulrelevanter Testtypen und ihrer Anwendungsbedingungen): 5. Quantitative und qualitative Auswertungen

5. Quantitative und qualitative Auswertungen

Die bisher besprochene Auswertung ist die sogenannte "quantitative Auswertung"; bei ihr geht es um die Gesamtleistung im Test (gegebenenfalls im Subtest), die als Rohwertsumme ermittelt und mithilfe der Normtabelle in einen Standardwert umgewandelt wird. (Anwendungen werden in Kap. 6 besprochen)

Ein differenzierender Spezialfall: Ist ein Schulleistungstest in mehrere Subtests aufgeteilt, so wird es im Rahmen der quantitiven Auswertung mehrere Rohwertsummen geben. Das kommt bei den Mehrfächertests vor (z.B: AST 3 von Fippinger, 1991; die Teile bzw. Subtests hier heißen Sprachverständnis, Sachkunde, Zahlenrechnen, Textaufgaben und Rechtschreiben). Die einzelnen Teile werden also völlig getrennt ausgewertet und die einzelnen Rohwert-summen mit je eigenen Normtabellen in Standardwerte umgewandelt. Zusätzlich wird auch ein Gesamtwert ermittelt.

Es gibt jedoch auch Tests, die sich nur auf ein einziges Unterrichtsfach beziehen und dennoch in Subtests aufteilbar sind. Besonders sinnvoll ist diese Aufteilung, wenn die Subtests "faktorenrein" sind. Das verlangt in der Konstruktionsphase eine Eingabe aller Testitems in das statistische Verfahren der Faktorenanalyse. Damit werden unabhängige Faktoren (Teilinhalte) ermittelt. Wenn das Verfahren erfolgreich anwendbar war, kann jedes Item je einem der ermittelten Faktoren (Subtests) zugeordnet werden. Ein Beispiel ist der DEMAT 4 (Görlitz, Roick & Hasselhorn, 2006); die drei gewonnenen Faktoren, dort Bereiche genannt, heißen Arithmetik, Sachrechnen und Geometrie. Für jeden der Faktoren gibt es eine Norm-tabelle, ebenso wie für die Gesamtleistung.

Zusätzlich zur quantitativen bieten manche Tests auch eine "qualitative Auswertung" an. Obwohl heute bei den meisten Schulleistungstests das Ergebnis aus Punkten für richtige Lösungen gebildet wird, richtet man bei der qualitativen Auswertung den Blick auf die Fehler, weshalb man hier auch "Fehleranalyse" sagen kann. Als sprachliche Klärung dieses üblichen Begriffs: Es geht um die Qualität, also die Art der Fehler. Es leuchtet unmittelbar ein, dass mit einem Einblick in die Fehlerstruktur der einzelnen Schüler eine weitere Dimension der Testaussage gewonnen ist. Der Auswerter kann die Fehler analysieren und, was ein besonderes praktisches Ziel darstellt, auf dieser Grundlage Inhalte für Stütz- und Förder-maßnahmen empfehlen.

Wenn eine solche qualitative Auswertung angeboten werden soll, muss zuerst ein System von Fehlerkategorien entwickelt werden. Das kommt am häufigsten bei Rechtschreibtests und bei Mathematiktests vor. Ein Beispiel für ein System von Fehlerkategorien aus dem Würzburger Rechtschreibtest für 2. Jahrgangsstufe (WÜRT 2+), Trolldenier (2014), Fehlersystem angelehnt an Kossow (1991) und erweitert:

Fehlerkategorien WÜRT

A (Auslassung eines Lautes)
Anwendung: Ein hörbarer Laut wird ausgelassen. Beispiel: Krsche statt Kirsche
H (Hinzufügung eines Lautes)
Anwendung: Ein hörbarer Laut wird hinzugefügt. Beispiel: gehenen statt gehen
LV (Lautverwechslung)
Anwendung: Ein Laut wird mit einem hörbar unterschiedlichen Laut vertauscht. Beispiel: Kemüse statt Gemüse
SW (Starke Wortbildveränderung)
Anwendung: Das Wort ist zu stark verändert, um es sinnvoll in einzelne Fehlerkategorien einzuteilen. Beispiel: diken statt blühen
GK (Verstöße gegen die Groß- und Kleinschreibung)
Anwendung: Ein Buchstabe wurde fälschlicherweise groß- oder kleingeschrieben. Beispiel: apfel statt Apfel
Lf (Lautgetreu, aber falsch)
Anwendung: Ein Laut wurde phonetisch richtig, jedoch orthografisch falsch geschrieben. Beispiel: Schpiel statt Spiel
AW (Auslassung eines ganzen Wortes)
Anwendung: Das Wort wird vollständig ausgelassen oder durch ein anderes Wort oder Zeichen ersetzt.
R (Restfehler)
Anwendung kommt kaum vor: ist ein Sammelbecken für die sehr seltenen Fälle, in denen einmal eine Einordnung in eine der anderen Kategorien nicht möglich ist.

Noch ein Begriffspaar:

Nach der Verarbeitung der Ergebnisse unterscheidet man zwischen selektionsorientierter und förderorientierter Diagnostik (s. etwa Jäger, 2003). Das geschieht häufig in der sonder-pädagogisch-psychologischen Diagnostik, die sich an manchen Standorten Förderdiagnostik nennt. Dieser Zweiteilung kann die Unterscheidung in quantitative und qualitative Auswertung in etwa entsprechen, ohne dass wir hier diese gelegentlich etwas vorbelastete Diskussion stärker ausbreiten wollen.