Erste Erfahrungen mit der API
Im letzten Post habe ich schon erste unsystematische Eindrücke aus unserer Arbeit mit der ads_archive_api von Facebook geteilt. Inzwischen können wir die Daten auch systematisch auswerten. Hier erste Ergebnisse.
Problematische Datenqualität
Die Analyse bezieht sich auf bezahlte politische Werbeanzeigen, die Facebook in das Archiv geschoben hat. Wir wissen nicht, nach welchen Kriterien etwas als politisch gelabelt wird und wir wissen auch nicht, ob die Daten für den jetzigen Zeitraum vollständig sind oder in den kommenden Wochen noch ergänzt werden. Es spricht viel dafür, dass die Einteilung politisch/unpolitisch maschinell vorgenommen wird. Die teuerste Anzeige mit der weitesten Reichweite (Impressions) ist eine Werbung für Klavierkonzerte. Die zweitteuerste für Batman-Tshirts. Das heißt, erstens sind falsch-positiv gelabelte Daten im Archiv. Und dabei ist es gut möglich, dass diese Daten - da sie eigentlich aus einer anderen Gesamtverteilung (nicht-politische Werbung) kommen - starke Outlier-Effekte aufweisen. Sprich: schaut man auf den Mittelwert von Bezahlung und Reichweite, dann sind diese Werte eventuell verfälscht. Zweitens ist davon auszugehen, dass es auch falsch-negative Daten gibt, dass also gar nicht alle Anzeigen tatsächlich gefunden wurden. Alles ganz normal, aber ein Problem ist schon, dass es keine Auskunft von Facebook über die Vorgehensweise bei der Kategorisierung und über ihre Genauigkeit gibt.
Hinzu kommt, dass zum jetzigen Zeitpunkt noch nicht klar ist, ob das Archiv vollständig ist. Problematisch ist - im Moment - dass Facebook nicht nur neue Daten hinzufügt, sondern Daten, die grundlegend anders sind. Zuerst wurden wirkliche Werbeanzeigen veröffentlicht. Seit gestern sind jetzt auch Posts integriert, die direkt von der/dem Seitenbetreiber*in beworben wurden. Diese Daten haben eine andere Struktur und sind auch politisch anders einzuschätzen, da es sich dabei um Posts handelt, die jeder auf der Seite sehen kann (anders als bei Werbung, die gezielt geschaltet wird).
Facebook könnte hier für wesentlich mehr Transparenz sorgen, wenn ein Codebook des Datensatzes veröffentlicht würde.
Es lässt sich unterscheiden zwischen wirklicher Werbung, die dann eine "funding entity" hat, und Posts, die beworben wurden, die nur der Seite zugeordnet werden können.
Die SPD schaltet mit Abstand die meisten Anzeigen. Beispiele dafür gab es schon im letzten Blogbeitrag.
Hinzu kommt, dass zum jetzigen Zeitpunkt noch nicht klar ist, ob das Archiv vollständig ist. Problematisch ist - im Moment - dass Facebook nicht nur neue Daten hinzufügt, sondern Daten, die grundlegend anders sind. Zuerst wurden wirkliche Werbeanzeigen veröffentlicht. Seit gestern sind jetzt auch Posts integriert, die direkt von der/dem Seitenbetreiber*in beworben wurden. Diese Daten haben eine andere Struktur und sind auch politisch anders einzuschätzen, da es sich dabei um Posts handelt, die jeder auf der Seite sehen kann (anders als bei Werbung, die gezielt geschaltet wird).
Facebook könnte hier für wesentlich mehr Transparenz sorgen, wenn ein Codebook des Datensatzes veröffentlicht würde.
Ein Überblick
Derzeit sind 6.875 Anzeigen im Archiv. Der Zeitraum geht zurück bis 21.05.2018.Es lässt sich unterscheiden zwischen wirklicher Werbung, die dann eine "funding entity" hat, und Posts, die beworben wurden, die nur der Seite zugeordnet werden können.
![]() |
Anzahl der geschalteten Werbungen per Funding Entity |
![]() |
Anzahl der beworbenen Posts per Page |
![]() |
Summe Impressions |
![]() |
Summe Spendings |
In Bezug auf die bislang veröffentlichten Daten ist die SPD ganz klar hervorzuheben. Die Sozialdemokraten sind auf einem ganz anderen Niveau unterwegs, was Facebook-Werbung anbelangt. Sie geben viel mehr aus und erreichen damit - wie zu erwarten - auch viel mehr Personen.
Sollten nicht noch wesentliche Teile des Datensatzes fehlen, wäre das schon sehr bemerkenswert.
Bedeutung von bezahlter politischer Werbung
Basierend auf den derzeitigen Daten kann man nur festhalten, dass bezahlte politische Werbung auf Facebook in Deutschland bislang wohl keine Rolle spielt. Im US-Archiv finden sich beispielsweise ca. 200.000 Anzeigen alleine von Donald Trump. Selbst die ca. 3.000 Anzeigen der SPD sind dagegen verschwindend wenig, selbst wenn man die Unterschiede in der Wahlbevölkerung berücksichtigt. Sollte sich die Datenlage nicht noch grundlegend ändern, kann davon ausgegangen werden, dass die Befürchtungen hinsichtlich "dark ads" und ähnlichem für Deutschland übertrieben sind.