2021 stellten wir uns die Frage, wie es eigentlich um Diversität in den Redaktionen und Newsrooms in Deutschland bestellt ist. Unseren Eindruck, dass es einen Mangel an Diversität gibt, wollten wir mit Zahlen belegen. Das war der Startschuss für dieses Projekt. Am Anfang unserer Recherche haben wir mit mehreren Datenteams aus Redaktionen gesprochen und so versucht herauszufinden, wie es um die Vielfalt in den Redaktionen bestellt ist. Selbst zu vermeintlich einfachen Fragen wie der Verteilung von Frauen und Männern bekamen wir fast überall dieselbe Antwort: Die Statistiken liegen entweder intern nicht vor oder konnten aus Gründen des Datenschutzes nicht mit uns geteilt werden. Um trotzdem einen Eindruck zu gewinnen, wie viele männliche und weibliche Autor*innen für die einzelnen Medien schreiben, haben wir die Informationen verwendet, die auf den Seiten der Medien veröffentlicht werden: die Namen von Redakteuren und Redakteur*innen. Wir haben wochenlang gescrapt, anschließend die Daten manuell überprüft und ausgewertet.
Unsere Arbeit war inspiriert von den folgenden Projekten: dem BBC Equality Project, das es sich zur Aufgabe gemacht, Journalismus und Medieninhalte zu schaffen, die unsere Welt in ihrer Vielfalt darstellen, den Neuen Deutschen Medienmacher*innen, einer Interessenvertretung für Journalist*innen of Color und Medienschaffende mit Einwanderungsgeschichte, und ProQuote, einem Verein, der sich für mehr Frauen in journalistischen Führungspositionen einsetzt.
Wie wir vorgegangen sind (damit ihr es auch könnt)
Zunächst klingt es einfach, die Namen der Autor*innen von online publizierten Artikeln ausfindig zu machen, zu zählen und deren Geschlecht zu ermitteln. Dem war keineswegs so. Auf dem Weg von der Idee bis zu diesem Artikel sind wir zahlreichen Überraschungen und Herausforderungen begegnet.
Die erste Entscheidung: Welche Medienhäuser sollen in unsere Analyse eingehen? Hier haben wir uns an der Auflage orientiert, um möglichst viele Leser*innen sowie ein möglichst großes Meinungsspektrum abzubilden. In der Auswahl finden sich deshalb konservative sowie liberale, alteingesessene sowie jüngere Medienhäuser. Unsere finale Auswahl umfasst die Online-Redaktionen der ZEIT, des SPIEGEL, der Bild, der FAZ, der SZ sowie der taz. Zusammen haben sie viele Millionen deutschsprachige Leser*innen.
Der zweite Schritt: Die Datengrundlage
Als Nächstes stand die Entscheidung an, wie viele Artikel wir brauchen, um ein repräsentatives Ergebnis abzubilden. Auch haben wir den Zeitraum der Datenerhebung diskutiert – schließlich wird die Berichterstattung stark vom politischen Geschehen und Umständen wie der Pandemie oder der Inflation beeinflusst. Um dies auszugleichen, haben wir in drei Zeiträumen Daten erhoben: 1.-7.12.2021, 15.-21.05.2022 sowie vom 6.-13.02.2023.
Die Methode zur Auswertung
Alle Artikel, die in dieser Zeit von den jeweiligen Medienhäusern online veröffentlicht wurden, gelangten in unseren Datenpool. Jeder Artikel wurde automatisiert auf die Nennung eine*r Autor*in durchsucht. War ein Autor*innenname (oder mehrere) vorhanden, so wurde diese mithilfe des online verfügbaren Tools genderize.io auf das wahrscheinlichste Gender der entsprechenden Person hin kategorisiert. Das Tool genderize.io wirft für jeden Namen eine Wahrscheinlichkeit des vermuteten Geschlechts aus. Wir sind uns bewusst, dass ein solcher Algorithmus nie ohne Bias ist. Die Ergebnisse wurden zusätzlich manuell überprüft.
Mitwirkende
Jeannette Gusko
Kübra Gümüsay
Salsabil Hamadache
Elisa Harlan
Julia Kloiber
Programmierung & Datenerfassung: Cecilia Palmér
Design: Rainbow Unicorn