Studie: Objektives Richten im Spitzensport aufgrund des komplexen Systems quasi unmöglich

Von
PS-220806-Grand Prix-6422

Ingrid Klimke, WM Herning 2022, Franziskus, Schlussgruß (© Pauline von Hardenberg)

Die Pferdewissenschaftlerin Prof. Dr. Inga Wolframm von der Universität Van Hall Larenstein hat in einer Studie nachgewiesen, was schon häufiger vermutet wurde: Dressurnoten werden im Spitzensport nicht immer objektiv vergeben. In der Untersuchung konnten mehrere Arten der Voreingennommenheit (den sogenannten „bias“) ausgemacht werden. Die Komplexität des Bewertungssystems trage wesentlich dazu bei, dass die Richter in bestimmten Situationen sich auf andere Informationsquellen beziehen, als die in dem Moment tatsächlich gezeigte Leistung.

Wie steht es um die Voreingenommenheit der Dressurrichter? Natürlich sollte die Bewertung von Dressurprüfungen objektiv sein. Allerdings führt die Kombination des limitierten kognitiven Vermögens des Menschen, des sehr komplexen Beurteilungssystems und des Zeitdrucks dazu, dass Richter sich in Momenten des Zweifels auf andere Informationsquellen verlassen müssen. Die These der Wissenschaftlerin: Um die große Komplexität des Richtens von Dressurprüfungen zu verringern, nehmen die Richter ohne es zu wissen sogenannte „kognitive Abkürzungen“. Das sind „mentale Hilfsmittel“, die Menschen helfen, in kurzer Zeit die relevantesten Informationen heraus zu filtern, um eine schnelle Entscheidung treffen zu können. So werden in Momenten von Zweifel – ist die Traversale jetzt eine 8 oder eine 8,5 wert? – mitunter schnell verfügbare, andere Informationsquellen hinzugezogen, die nichts mit der eigentlichen Leistung zu tun haben. 

Nationalistische Effekte und Vorteile für etablierte Paare

Prof. Wolframm hat 510 Prüfungsprotokolle von Richtern sieben verschiedener internationaler Fünf-Sterne-Dressurturniere zwischen Mai 2022 und April 2023 untersucht. Als Variablen für die Untersuchung wählte die Wissenschaftlerin in Bezug auf den Reiter/die Reiterin:

  • gleiche Nationalität wie der Richter
  • gleiche Nationalität wie ein anderer Richter aus dem Gremium
  • Start im Heimatland
  • Weltranglistenposition bei der FEI
  • Startplatz (also ob jemand früh oder erst gegen Ende der Prüfung ins Viereck kommt)

Diese Aspekte wurden in Bezug gesetzt zu dem jeweiligen Ergebnis des Dressurpaares mit dem Ergebnis: Alle fünf Faktoren beeinflussten die Notengebung signifikant. „Fast die Hälfte der Varianz in den Dressurnoten kann durch die Kombination dieser fünf Faktoren erklärt werden.“ Das bedeutet konkret: Dressurpaare wurden besser bewertet aufgrund eines Kaskadeneffektes (also quasi Folgeeffekts wie bei einem Wasserfall, der sich über mehrere Stufen ergießt). Die als entscheidend identifizierten fünf Faktoren lauten gemäß der Variablen:

  • Reiter stammt aus dem gleichen Land wie der Richter (nationalistischer Effekt)
  • Reiter stammt aus dem gleichen Land wie ein anderer Richter (Patriotismus durch Stellvertreter)
  • Start im Heimatland
  • höhere Position in der FEI-Weltrangliste (Voreingenommenheit aufgrund des Ansehens)
  • späterer Startplatz (Richter bewerten Gesehenes im Vergleich zum vorigen Starterpaar und tendieren zu einer höheren Note)

Dabei sei zu bedenken, dass die Faktoren „höhere Position in der FEI-Weltrangliste“ und „späterer Startplatz“ häufig miteinander einhergehen. In Summe können diese Faktoren etablierten Paaren einen Vorteil verschaffen, so die Studie.

In dem multifaktoriellen Regressionsmodell, in dem die fünf verschiedenen Faktoren zusammen mit einfließen, hat der Heimvorteil eigentlich einen negativen Effekt. Als Grund hierfür wird die unterbewusste Überkompensation der Richter in Form einer strengeren Benotung eines Paares der Grund vermutet. Aber da bei den untersuchten sieben Turnieren auch jedes Mal ein Richter aus dem Land des Reiters anwesend war, führten die Faktoren „nationalistischer Effekt“ und „Patriotismus durch Stellvertreter“ unter dem Strich doch zu einem positiven Heimvorteil.


Die Autorin der Studie: Prof. Dr. Inga Wolframm

Sanne van Zalen

Prof. Dr. Inga Wolframm (© Sanne van Zalen)

Professorin für nachhaltigen Pferdesport an der Universität of Applied Sciences Van Hall Larenstein (Niederlande). Master in „Human and Equine Sport Science“, Promotion in Sport­psychologie. Hat in verschiedenen Bereichen des Pferdesports geforscht, war zuletzt an der Veterinärmedizinischen Fakultät Utrecht für die Zusammen­arbeit mit Partnern aus Gesellschaft und Wirtschaft verantwortlich.


„Von Richter wird das Unmögliche verlangt“

Die beschriebenen „kognitiven Abkürzungen“ kommen laut der Wissenschaftlerin deshalb zum Tragen, weil „von Richtern das Unmögliche verlangt“ werde. Sie müssen blitzschnelle Entscheidungen treffen und dabei wird von ihnen erwartet, dass sie viele Faktoren im Blick haben – von der möglichen Athletizität des Pferdes auf Basis seines Körperbaus, der Ausbildung nach den Richtlinien, wie akkurat in der Prüfung geritten wird bis hin zur Qualität der Partnerschaft zwischen Reiter und Pferd und der Bewertung vor dem Hintergrund des „Welfare of the horse“, also des Tierwohls. Jede Bewegung muss vom Richter auf Basis aller sechs Stufen der Skala der Ausbildung sowie vor dem Hintergrund der Korrektheit und des Gehorsams beurteilt werden. Mitunter innerhalb weniger Sekunden.

Aufgrund dieser hochkomplexen Ansprüche an die Bewertung der Richter müssen sie laut Prof. Wolframm „unweigerlich und ungewollt auf andere, leichter zugängliche Informationsquellen zurückgreifen, wie z. B. Nationalität, frühere Leistungen, Ansehen und Startreihenfolge.“ Daraus entstehe der Kaskadeneffekt, jeder der Faktoren verstärke den anderen. Systematische Fehler in der Bewertung von Dressurprüfungen sind die Folge.

Es braucht mehr Transparenz und evidenzbasierte Kriterien

Mit diesen Ergebnissen kommt die Studie zu dem Schluss, dass es ein transparentes Bewertungssystem braucht, das auf evidenzbasierten Kriterien beruht. Nur dann könne sowohl für Pferde und Reiter, als auch für Richter ein objektiveres und verlässlicheres Richten möglich werden. Die Wissenschaftlerin schlägt vor, die Aufgaben unter den Richtern zu verteilen, um die kognitive Belastung jedes einzelnen Richters zu verringern. So müssten Richter weniger auf unterbewusste kognitive Abkürzungen zurückgreifen, heißt es in der Studie. Die Aufteilung könnte zum Beispiel so aussehen: Wohlergehen von Pferden, sportliche Leistung, Effektivität des Reiters und Genauigkeit der Bewegung. Sie alle müssten laut der Studie evidenzbasiert sein und offen für eine stetige Überprüfung und ggf. Anpassung sein. Die Wissenschaftlerin strebt danach, eventuelle Lösungen gemeinsam mit der Praxis zu erarbeiten.

Die ganze Studie ist hier nachzulesen.

Gloria Lucie AlterRedakteurin

Hat sich parallel zum Volontariat beim St.GEORG im Studium mit „Digital Journalism“ an der Hamburg Media School befasst. Als Redakteurin liefert sie Beiträge aus den unterschiedlichsten Bereichen, von Reitlehre bis zu Produktneuheiten. Ihre Erfahrungen aus Tätigkeiten bei privaten TV-Sendern in Köln ergänzen sich mit ihrer Kompetenz in Social Media und Videocontent.