Politische Werbung auf Facebook

Erste Erfahrungen mit der API

Im letzten Post habe ich schon erste unsystematische Eindrücke aus unserer Arbeit mit der ads_archive_api von Facebook geteilt. Inzwischen können wir die Daten auch systematisch auswerten. Hier erste Ergebnisse.

Problematische Datenqualität

Die Analyse bezieht sich auf bezahlte politische Werbeanzeigen, die Facebook in das Archiv geschoben hat. Wir wissen nicht, nach welchen Kriterien etwas als politisch gelabelt wird und wir wissen auch nicht, ob die Daten für den jetzigen Zeitraum vollständig sind oder in den kommenden Wochen noch ergänzt werden. Es spricht viel dafür, dass die Einteilung politisch/unpolitisch maschinell vorgenommen wird. Die teuerste Anzeige mit der weitesten Reichweite (Impressions) ist eine Werbung für Klavierkonzerte. Die zweitteuerste für Batman-Tshirts. Das heißt, erstens sind falsch-positiv gelabelte Daten im Archiv. Und dabei ist es gut möglich, dass diese Daten - da sie eigentlich aus einer anderen Gesamtverteilung (nicht-politische Werbung) kommen - starke Outlier-Effekte aufweisen. Sprich: schaut man auf den Mittelwert von Bezahlung und Reichweite, dann sind diese Werte eventuell verfälscht. Zweitens ist davon auszugehen, dass es auch falsch-negative Daten gibt, dass also gar nicht alle Anzeigen tatsächlich gefunden wurden. Alles ganz normal, aber ein Problem ist schon, dass es keine Auskunft von Facebook über die Vorgehensweise bei der Kategorisierung und über ihre Genauigkeit gibt.
Hinzu kommt, dass zum jetzigen Zeitpunkt noch nicht klar ist, ob das Archiv vollständig ist. Problematisch ist - im Moment - dass Facebook nicht nur neue Daten hinzufügt, sondern Daten, die grundlegend anders sind. Zuerst wurden wirkliche Werbeanzeigen veröffentlicht. Seit gestern sind jetzt auch Posts integriert, die direkt von der/dem Seitenbetreiber*in beworben wurden. Diese Daten haben eine andere Struktur und sind auch politisch anders einzuschätzen, da es sich dabei um Posts handelt, die jeder auf der Seite sehen kann (anders als bei Werbung, die gezielt geschaltet wird).
Facebook könnte hier für wesentlich mehr Transparenz sorgen, wenn ein Codebook des Datensatzes veröffentlicht würde.

Ein Überblick

Derzeit sind 6.875 Anzeigen im Archiv. Der Zeitraum geht zurück bis 21.05.2018.
Es lässt sich unterscheiden zwischen wirklicher Werbung, die dann eine "funding entity" hat, und Posts, die beworben wurden, die nur der Seite zugeordnet werden können.

Anzahl der geschalteten Werbungen per Funding Entity

Die SPD schaltet mit Abstand die meisten Anzeigen. Beispiele dafür gab es schon im letzten Blogbeitrag.

Schaut man nach den häufigsten Page-Namen, ist die SPD auch vorne (Aber die Daten überschneiden sich extrem. Wenn SPD die Funding Entity ist, dann ist meistens auch die SPD-Seite angegeben).

Anzahl der beworbenen Posts per Page

Interessanter ist schon die Analyse der Reichweite. Facebook gibt für jede Anzeige an, in welchem Bereich sich die Impressions bewegen, also zum Beispiel zwischen 0 und 999, zwischen 1000 und 4999, 5000 und 9999 usw. Wir haben diese unteren und oberen Reichweiten für jeden Anzeigenbetreiber addiert.

Summe Impressions

Das gleiche lässt sich auch für die Ausgaben für Werbung machen.

Summe Spendings

In Bezug auf die bislang veröffentlichten Daten ist die SPD ganz klar hervorzuheben. Die Sozialdemokraten sind auf einem ganz anderen Niveau unterwegs, was Facebook-Werbung anbelangt. Sie geben viel mehr aus und erreichen damit - wie zu erwarten - auch viel mehr Personen.

Sollten nicht noch wesentliche Teile des Datensatzes fehlen, wäre das schon sehr bemerkenswert.

Bedeutung von bezahlter politischer Werbung

Basierend auf den derzeitigen Daten kann man nur festhalten, dass bezahlte politische Werbung auf Facebook in Deutschland bislang wohl keine Rolle spielt. Im US-Archiv finden sich beispielsweise ca. 200.000 Anzeigen alleine von Donald Trump. Selbst die ca. 3.000 Anzeigen der SPD sind dagegen verschwindend wenig, selbst wenn man die Unterschiede in der Wahlbevölkerung berücksichtigt. Sollte sich die Datenlage nicht noch grundlegend ändern, kann davon ausgegangen werden, dass die Befürchtungen hinsichtlich "dark ads" und ähnlichem für Deutschland übertrieben sind.

Political Data Science

Dieses Blog durchsuchen