Direkt zum Hauptbereich

Als ich versehentlich Fake-News über Russia Today Deutschland (RT-Deutsch) verbreitet habe...

Letzte Woche schrieb die Wirtschaftswoche, eine Studie von mir würde zeigen, dass Russia Today Deutsch (RT-Deutsch) auf Facebook die einflussreichste deutsche Nachrichtenseite sei.
Das ist so leider Unfug. Hintergrund war, dass die Wirtschaftswoche eigentlich über ein Policypaper von mir zu Echokammern berichten wollte und dafür noch ein Beispiel suchte. Darauf hin hatte ich mitgeteilt, dass RT-Deutsch IN UNSEREN DATEN FÜR DIESES PROJEKT die größte Facebook-Seite sei. Diese Information hat sich dann etwas verselbstständigt...
Man kann aber einiges lernen an diesem Fall: 

In Social Media Analysen sind Daten nicht einfach objektiv

Es kommt stark auf den Zeitraum und die Erhebungsmethode an. Da Facebook ein sehr dynamisches Netzwerk ist, können sich sogar Daten, die sich eigentlich auf die Vergangenheit beziehen, ständig änder: Accounts werden gesperrt, ein Post, der früher kaum beachtet wurde, wird plötzlich populär etc. Hinzu kommt, dass jeder sich die Daten über die Schnittstellen von Facebook (API) selbst zusammensucht. Das ist ein nicht trivialer Prozess, der auf unterschiedliche Art und Weise durchgeführt werden kann und eventuell zu unterschiedlichen Ergebnissen führt. Es gibt noch dazu kaum Studien, die unterschiedliche Datensätze, die eigentlich identisch sein sollten, vergleichen.

Facebook hat sich über den Artikel in der Wirtschaftswoche beschwert (der Artikel wurde dann online entfernt aber leider bislang nicht richtig gestellt) und auf Daten des Drittanbieters http://www.fanpagekarma.com/ verwiesen.

Also, vergleichen wir Mal unsere Daten (political data science) mit denen von Fanpagekarma.
Die folgenden Plots zeigen die Posts, Likes und Comments auf der RT-Deutsch Fanpage für den Zeitraum, um den es in unserer Untersuchung ging (02.01.2015 - 31.01.2017)
Wären die Daten identisch, lägen alle Punkte auf der diagonalen Linie. Wir haben also was die Comments und Likes anbelangt mehr Daten als Fanpagekarma, aber die Abweichungen sind auch nicht besonders groß. Eine manuelle Untersuchung bestätigt uns, dass unsere Daten eher zu stimmen scheinen. Vermutlich kommen die Unterschiede daher, dass unsere Daten aktueller sind.

Wie bedeutend ist RT-Deutsch?

Die eigentliche Frage ist nun, welche Relevanz hat RT-Deutsch tatsächlich. Wichtig ist, dass Relevanz keine Kategorie ist, die in den Daten einfach vorliegt. Man könnte die Anzahl der Klicks betrachten, die Anzahl der Views, einen Indikator für Reichweite berechnen etc. In den Daten haben wir Informationen über die Posts, Likes, Comments und die Anzahl der Reactions und Shares. Um Diskussionen über unsere Daten zu vermeiden, nutzen wir hier die fanpagekarma Daten. Eine Aussage über die Relevanz macht nur Sinn im Vergleich mit anderen Medienseiten. Wir haben uns für diese Analyse relativ willkürlich für die Facebookseiten von ARD, Bild, RT-Deutsch, Süddeutsche Zeitung, Welt und Wirtschaftswoche entschieden. Um eine Vergleichbarkeit zu ermöglichen haben wir uns auf die Aktivitäten in 2017 beschränkt. Die folgende Grafik zeigt die täglichen Aktivitäten auf den Seiten.
Auffällig ist, dass RT-Deutsch bei der Anzahl der Posts an manchen Tagen Spitzenreiter ist. Sobald es aber um die Reaktionen der Nutzer geht, liegt die Bild unangefochten vorne.

Wenn wir nun diese täglichen Aktivitäten aufsummieren, bestätigt sich der Eindruck:



RT-Deutsch ist eine wichtige Medienseite im Vergleich zu anderen deutschen Angeboten. Es ist aber nicht die Seite, die die meisten Menschen erreicht!

Hinzu kommt: Bei unseren Facebook-Analysen stellen wir immer wieder fest, dass die Anzahl der Likes und Comments stark verzerrt werden durch hyperaktive Nutzer: Einige wenige Nutzer sind so aktiv, dass sie für einen großen Teil der Likes und Comments auf den Seiten verantwortlich sind. Die Anzahl der Comments für sich spricht daher nicht für eine echte Reichweite.

Aber: Statistiken wie die hier präsentierten sind die Grundlage für die Algorithmen von Facebook. Viele Comments und Likes können also durchaus dazu führen, dass Inhalte von RT-Deutsch auch anderen Nutzern vorgeschlagen werden.

Update


Kommentare

Beliebte Posts aus diesem Blog

Kritik an dem Science-Artikel der Priesemann-Gruppe „Inferring change points in the spread of COVID-19 reveals the effectiveness of interventions“

Der Science-Artikel von Dehning et al. (2020) gilt als Beleg für die Effektivität der Corona-Maßnahmen in Deutschland im März 2020. Wir glauben, dass der Artikel gravierende Fehler enthält und daher nichts darüber aussagt, ob insbesondere das Kontaktverbot vom 23.03.2020, irgendeinen Effekt hatte. Unsere Kritik haben wir bei Science eingereicht und sie ist hier zu finden: https://science.sciencemag.org/content/369/6500/eabb9789/tab-e-letters Im folgenden übersetze ich unseren Beitrag und gehe anschließend auf die Frage ein, wie Wissenschaft unter COVID-19-Bedingungen funktioniert und was daran bedenklich ist. Eine Kritik an ‘Inferring change points in the spread of COVID-19 reveals the effectiveness of interventions’ Wir haben den Artikel ‘Inferring change points in the spread of COVID-19 reveals the effectiveness of interventions’ analysiert und dabei gravierende Unstimmigkeiten im Design der Studie festgestellt: Anstatt das Datum der Wendepunkte (wann sich die COVID-19-Entwicklung i

Deep-Dive Impfeffektivität: Eine kritische Datenanalyse der RKI-Berechnungen / Teil 1: Die Methode

Die Einschätzung, wie effektiv die COVID-Impfung ist, ist eine der politisch relevantesten Kennzahlen derzeit. Insbesondere für die Einschätzungen der Angemessenheit einr Impfpflicht ist diese Zahl extrem wichtig. In der Vergangenheit hat sich immer wieder gezeigt, dass die Berechnungen des RKI nicht in jeder Hinsicht eindeutig sind, sondern auf vielen Annahmen beruhen, die man auch kritisch hinterfragen kann und muss. Für die politische Datenwissenschaft ist es daher essenziell, diese Berechnungen nachvollziehbar zu machen. In diesem Beitrag wird das methodische Vorgehen des RKI zur Berechnung der Impfeffektivität analysiert. Die Informationen dazu entstammen den RKI-Wochenberichten .  In einem zweiten Teil habe ich die konkreten Berechnungen des RKI so weit wie möglich rekonstruiert und kann daher zeigen, wie stark die Ergebnisse schwanken, wenn Annahmen leicht verändert werden. Meine Erkenntnisse aus der folgenden Analyse: Das RKI verwendet zur Berechnung der Impfeffektivität die Me

Neue Veröffentlichung: Der Aufstieg der #AfD in den Sozialen Netzwerken

Das Political Data Science Team hat eine neue Veröffentlichung zum Thema " The Rise of Germanys AfD: A Social Media Analysis " vorzuweisen. Erstautor ist der fabelhafte Juan Carlos Medina Serrano und der Artikel ist als open access erschienen als: Serrano, Juan Carlos Medina, Morteza Shahrezaye, Orestis Papakyriakopoulos, and Simon Hegelich. "The Rise of Germany's AfD: A Social Media Analysis." In Proceedings of the 10th International Conference on Social Media and Society, pp. 214-223. ACM, 2019. URL:  https://dl.acm.org/citation.cfm?id=3328562 Cross-platform-analysis Ein großes Problem in der aktuellen Social Media Forschung ist, dass meistens nur einzelne Plattformen (und häufig nur Twitter) betrachtet werden. Wir untersuchen in dem Artikel Twitter, Facebook, Instagram und YouTube und schauen auf die Beiträge der deutschen Parteien. Der Vergleich von unterschiedlichen Plattformen ist nicht nur deshalb wichtig, weil ansonsten ein sehr verzerrtes Bild en