Data Science und Ethik

Wir begegnen Algorithmen tag täglich – mal bewusster, wenn wir mit Siri, Alexa oder dem Google-Assistant sprechen, mal unbewusster, wenn wir Rabatt-Gutscheine von Läden zugestellt bekommen. Das mögen unkritische Entscheidungen sein: Google empfiehlt uns ein Restaurant, das unseren Geschmack nicht ganz trifft, oder die MIGROS sendet uns einen Gutschein für einen uninteressanten Artikel.

 

Was aber, wenn ein Computer darüber entscheidet, ob jemand einen Job bekommt oder nicht? Da Computer nicht emotional entscheiden, sind solche Entscheide neutral und begründet, so unsere Annahme. Aber solche Algorithmen werden von Menschen entwickelt und somit kann eine gewisse «Prägung» der AI nicht ausgeschlossen werden. («Amazon scraps a secret A.I. recruiting tool that showed bias against women»)

Die Maschinen eignen sich ja (noch) nicht selbstständig Wissen an. Beim Machine-Learning findet ein Training mit ausgewählten Daten statt. Diese Daten sollen dem Computer eine Referenz geben, damit dieser seine Logik darauf aufbauen kann. Im Fall von Amazon wurde somit kein ausgewogenes Trainings-Dataset ausgewählt.

Die Auswirkungen können aber weitaus grösser sein als nur ein verpasster Anstellungs-Vertrag: In den Staaten berechnen Algorithmen einen Indikator über die Rückfälligkeit von Straftätern. Dieser Wert wird auch von Richtern für Verurteilungen verwendet. Beim Trainieren des Algorithmus wurde aber die Hautfarbe als relevantes Merkmal mitgegeben. Und so berechneten die künstlichen Intelligenzen höhere Risikowerte für farbige Kleinkriminelle als für weisse Verbrecher. («Machine Bias»)

Die zwei Beispiele verdeutlichen, dass ethische Werte bei der Bereitstellung von computer-gestützten Entscheidungshilfen äusserst relevant sind.

Ethischer Kodex für daten-basierte Wertschöpfung

Die Expertengruppe «Datenethik» der Swiss Alliance for Data-Intensive Services hat einen Kodex zusammengestellt, der Unternehmen helfen will, ethische Erwartungen ihrer Kunden, ihrer Mitarbeiter und der Gesellschaft in Einklang mit den eigenen Dienstleistungen zu bringen. Der Kodex ist dabei in die vier Etappen der Datennutzung unterteilt, ergänzt um übergreifende Governance-Aspekte:

Aufbau des Ethik Kodex

Datenbeschaffung und -Erzeugung

Bei der Datenerhebung wird geschaut, wie die zu verwendende Daten erworben wurden. Der Kodex beschreibt in dieser Etappe mitunter die Datentransparenz: Es sollte auf leichte und verständliche Weise erklärt werden, wie die Datenschutzpolitik aussieht und wozu die Daten von Kunden verwenden.

Datenspeicherung und -Management

Die erhobenen oder gesammelten Daten müssen gespeichert werden. Es ist festzulegen, wie diese aktualisiert oder gelöscht werden und wer Zugriff auf diese Daten hat. Hier soll als Beispiel vermieden werden, eine ungenügende Anonymisierung der Daten vorzunehmen. Oft reicht es nicht, nur die Namen aus den Datensätzen zu löschen, da mit den verbleibenden Daten die gelöschten Datenfelder rekonstruiert werden können.

Datenanalyse und Wissensgenerierung

Im dritten Schritt erfolgt die eigentliche Gewinnung von Wissen aus den Daten. Es werden z.B. Histogramme erstellt oder eben Prognosemodelle mit Hilfe maschinellen Lernens. Der Kodex adressiert hier genau die oben genannten Beispiele: Diskriminierungen sollen vermieden werden. Die Wahl der verwendeten Kriterien, die für ein Algorithmus verwendet werden, sollen erklärt werden. In einer allgemein gut verständlichen Art soll auch erklärt werden, wozu ein Modell verwendet wird.

Nutzung von datenbasierten Produkten oder Dienstleistungen

Schlussendlich will man mit den Daten einen Mehrwert schaffen: Man will als Beispiel Kunden zu mehr Konsum bringen, HR-Prozesse effizienter abwickeln oder das Risiko einer Rückfälligkeit von Straftätern ermitteln. Dabei sollten auch negative Folgen über die Kunden hinaus bedacht werden. So könnten die gesammelten Daten oder die Ergebnisse der Modelle von Akteuren mit weniger guten Absichten missbraucht werden.

Aufbau von ethischer Governance

Damit über alle Projekte hinweg dieselben ethischen Werte eingehalten werden, können Personen und Rollen bezeichnet werden, die sicherstellen, dass die ethischen Standards eingehalten werden. Auch sollte die Nachverfolgbarkeit der ethischen Datenverarbeitung über den ganzen Prozess hinweg sichergestellt werden.

 
Die Autoren des Kodex begrüssen jegliches Feedback. Der Kodex wird auf der Website der Data-Service-Alliance allen interessierten Personen und Unternehmen bereitgestellt: https://data-service-alliance.ch/innovation/ethics

Wünschen Sie Unterstützung beim Bewerten Ihrer Daten unter Einbezug ethischer Aspekte? Wir freuen uns auf Ihre Anfrage.