Direkt zum Hauptbereich

re:publica 2018: Algorithmische Gegenmacht

Inzwischen gibt es auch das Video zur Podiumsdiskussion:

Am 3.05., 17:30, Stelle ich unser neues Projekt mit der Hans-Böckler-Stiftung auf der re:publica vor und diskutiere mit Matthias Spielkamp und Katharina Simbeck, moderiert von Melanie Stein. Hier geht es zum Programm.
Unter anderem zeige ich, wie man den Analysealgorithmus von IBM Watson austricksen kann.

Hier der Link zum Projekt: https://www.boeckler.de/11145.htm?projekt=S-2017-375-2%20B

Und hier die Struktur meines Inputreferats:
Zunächst sollte man sich dieses Video von IBM Watson ansehen:




Und hier gibt es die Daten: https://www.ibm.com/communities/analytics/watson-analytics-blog/hr-employee-attrition/

IBM Watson kommt zu dem Schluss, dass Überstunden (OverTime) der wichtigste Faktor sind, um vorherzusagen, ob jemand das Unternehmen verlässt.

Ich habe versucht, den Decision Tree nachzubauen:
Dann simuliere ich mit Jackknifing, was passiert, wenn nur ein Teil der Daten zur Verfügung steht:
Man sieht also, dass man nicht einfach die erste Variable als wichtigste nehmen kann. Decision Trees sind nicht besonders robust, weil sie "gierig" sind: Sie nehmen immer die Unterteilung, die gerade am meisten bringt, ohne zu berechnen, welche Auswirkungen das für die nächsten Splits hat.

Hätte man viele simulierte Decision Trees kombiniert (Random Forest), wäre das Ergebnis übrigens ganz anders:
Anstelle von OverTime zeigt sich, dass das monatliche Einkommen viel entscheidender ist. Wenn die Personalabteilung also will, dass die Leute im Unternehmen bleiben, sollte sie höhere Löhne zahlen!

Abschließend kann man noch simulieren, wie Anfällig der Algorithmus ist, wenn nur einzelne Datenpunkte verändert werden:
Fazit: Wenn immer mehr Entscheidungen über Algorithmen getroffen werden, dann bedeutet das Wissen über diese Verfahren und der Zugang zu den Daten auch Macht. Diese Macht wird nicht von den Unternehmern (re)produziert, sondern von den Arbeitnehmern. Daher: Alle Flip-Flops stehen still, wenn dein schlauer Kopf es will!

Beliebte Posts aus diesem Blog

Deep-Dive Impfeffektivität: Eine kritische Datenanalyse der RKI-Berechnungen / Teil 1: Die Methode

Die Einschätzung, wie effektiv die COVID-Impfung ist, ist eine der politisch relevantesten Kennzahlen derzeit. Insbesondere für die Einschätzungen der Angemessenheit einr Impfpflicht ist diese Zahl extrem wichtig. In der Vergangenheit hat sich immer wieder gezeigt, dass die Berechnungen des RKI nicht in jeder Hinsicht eindeutig sind, sondern auf vielen Annahmen beruhen, die man auch kritisch hinterfragen kann und muss. Für die politische Datenwissenschaft ist es daher essenziell, diese Berechnungen nachvollziehbar zu machen. In diesem Beitrag wird das methodische Vorgehen des RKI zur Berechnung der Impfeffektivität analysiert. Die Informationen dazu entstammen den RKI-Wochenberichten .  In einem zweiten Teil habe ich die konkreten Berechnungen des RKI so weit wie möglich rekonstruiert und kann daher zeigen, wie stark die Ergebnisse schwanken, wenn Annahmen leicht verändert werden. Meine Erkenntnisse aus der folgenden Analyse: Das RKI verwendet zur Berechnung der Impfeffektivität di...

Der Nutzerismus: Eine Ideologie mit totalitärem Potential

Ich glaube, dass wir derzeit den Aufstieg einer Ideologie erleben, die ich Nutzerismus nennen möchte. Hannah Arendt hat darauf hingewiesen, dass jede Ideologie zu einem totalitaristischen Regime führen kann und es gibt ernste Anzeichen, dass dies auch für den Nutzerismus gilt.  Was ist der Nutzerismus? Wie bei jeder Ideologie ist der Kerngedanke sehr einfach: Im Prinzip gibt es für alle gesellschaftlichen Probleme eine technische Lösung. Leider wenden die Menschen die richtigen Technologien nicht an. Sie nehmen ihre Rolle als Nutzer nicht wahr. Es geht dem Nutzerismus also um das Zusammenspiel von Mensch und Technik, allerdings immer wieder aus der gleichen Perspektive. Die Technik kommt vor als potentielle Lösung eines gesellschaftlichen Problems. Eventuell fehlt die perfekte Lösung noch, aber das ist dann als Auftrag an die Wissenschaft und die Ingenieure zu verstehen. Dieser Technikglaube hat etwas sehr Naives. Er abstrahiert zum Beispiel von allen Interessen, für die Technolog...

#RTutorial: Using R to Harvest the Twitter STREAM API

Initializing the Twitter API In this tutorial, the so called STREAMING-API from Twitter is used. This API provides real-time access to Twitter, so the results are dependent from what is actually going on, right now. Before we start, we have to initialize the Twitter-API. To use the Twitter API, a consumer key and consumer secret is required. Therefore, you have to register as a developer who is creating a Twitter app. Create a Twitter account and then sign in at https://apps.twitter.com/. The account has to be verified with a phone number. This can be done on the Twitter webpage in the account settings. Fill in name, description and any valid URL with leading “http://”. It is important NOT to provide any call-back URL, because otherwise the registration from R will not function. After this, you can see a summary of your newly created app with a link to “manage keys and access tokens”. The consumer key and consumer secret that can be found there have to be copied into the following R-...