Bewertung ist in der Forschung essentiell. Doch Objekt des menschlichen Dranges zur Beurteilung kann selbst ein Hund werden. | Bild: Anthony Gerace, Keystone, Getty Images

Man stelle sich ein Peer-Review vor: Dutzende von Fachkolleginnen lesen eingehend einen Artikel, der bei einer wissenschaftlichen Zeitschrift eingereicht wurde. Jede füllt ein vorgegebenes Kriterienraster aus. Diese werden verglichen, Plus- und Minuspunkte gezählt und schliesslich festgehalten, was im Paper fehlt, was noch geändert werden muss oder auch, warum es abgelehnt wird. Die Entscheidung fällt in einer quantitativen Analyse. Etwa so könnte ein aus wissenschaftlichen Kriterien hergeleitetes Peer-Review aussehen.

In Realität läuft es aber ganz anders: Individuelle Bewertungen sind ausschlaggebend dafür, ob ein Artikel in einem Fachjournal veröffentlicht wird. Meistens evaluieren nur zwei Forschende ein eingereichtes Paper. Jede für sich allein. Aufgrund der Kommentare dieser beiden Personen entscheidet dann ein einzelner Redaktor der Fachzeitschrift: publizieren oder nicht.

«Man kann einfach unaufgeregt feststellen, dass es das Prinzip Subjektivität braucht, weil es – auch wenn es Mängel hat – einfach kein besseres gibt.»

Evidenz soll so statistisch aussagekräftig und unvoreingenommen sein wie irgend möglich. Es ist erstaunlich, dass ausgerechnet das System Wissenschaft, das dafür massenweise Daten produziert und analysiert, ohne Subjektivität im Kern gar nicht funktionieren könnte. Natürlich gibt es Versuche, diese Subjektivität zu umgehen, etwa mithilfe von öffentlichem Peer-Review oder durch künstliche Intelligenz, wie Sie in unserem Fokus zu Evaluierung lesen können. Dennoch bleibt die Subjektivität das herrschende Prinzip bei der Begutachtung von Forschungsarbeit. Manche beklagen, das sei eben falsch.

Dabei kann man einfach unaufgeregt feststellen, dass es das Prinzip Subjektivität braucht, weil es – auch wenn es Mängel hat – einfach kein besseres gibt. Das gilt besonders dann, wenn wie im Peer-Review jede Person theoretisch beides sein kann: Beurteilte und Urteilende. Diese dem System zugrunde liegende Fairness sollte konsequenter zum Tragen kommen. Dafür müssen möglichst viele unterschiedliche Forschende regelmässig Peer-Reviews machen, auch Nachwuchsforschende, sodass die Evaluierung nicht länger mehrheitlich von einem bestimmten Kreis Erfahrener durchgeführt wird. Wenn maximal unterschiedliche individuelle Meinungen zusammenkommen, ergibt das eine Gesamtbeurteilung, die weniger voreingenommen ist.