Künstliche Intelligenz und Bias

ki


26. September 2023 | Von Marie Graw

Künstliche Intelligenz (KI) bietet viele neue Möglichkeiten für Unternehmen. Sie kann uns Aufgaben abnehmen und Entscheidungen für uns treffen. Wenn es also darum geht, dass die KI repetitive Aufgaben erledigt und so für die Arbeitnehmenden mehr Zeit für kreatives und innovatives Arbeiten bleibt, ist die Technologie ein Segen. Von einem Segen zu einem Albtraum kann KI aber schnell werden, wenn so genannte „Bias“ auftreten, sie also nicht die gewünschten Ergebnisse liefert, oder gar falsche Entscheidungen trifft.

So passierte es, dass ein von Amazon entwickelter Algorithmus zur Unterstützung bei der Bewerber*innenauswahl Männer als geeignetere gegenüber Frauen einstufte. Grund dafür war, dass dem Algorithmus die in den letzten 10 Jahren eingegangenen Bewerbungen als Grundlage dienten. Dort spiegelte sich die Dominanz der Männer in der Technologiebranche wider – es gab deutlich mehr männliche Bewerber als weibliche. Somit leitete die KI ab, dass Lebensläufe, die das Wort „Frau“ beinhalten aussortiert werden, da diese Bewerberinnen schlechter geeignet sind.

Besonders dramatisch wird es, wenn die Entscheidungen der KI lebensverändernde Auswirkungen auf die Betroffenen haben. Ein in den USA angewandtes KI-System entschied durch die Berechnung der Rückfallquote von Angeklagten, ob sie auf Kaution aus dem Gefängnis entlassen werden. Die KI wurde mit Daten von Gefangenen trainiert (Bilder, Herkunft, Alter, etc.). Jedoch waren zu der Zeit aus denen die Datensätze stammten mehr dunkelhäutige als hellhäutige Menschen im Gefängnis und so entstanden Bias, welches dunkelhäutigen Menschen eine höhere Rückfallquote ausrechnete.

All dies sind Beispiele für KI-Bias. Doch was genau sind Bias, wie entstehen sie und was kann dagegen unternommen werden?

Was sind Bias?

In der Psychologie werden Bias als allgemeiner Verzerrungseffekt bezeichnet. Gemeint sind also Stereotypen oder andere Einstellungen, die die Wahrnehmung der eigenen Umwelt, Handlungen oder Entscheidungen in positiver oder negativer Art und Weise beeinflussen. Bias können in implizite (unbewusste) und explizite (bewusste) Bias unterschieden werden. KI muss von Menschen programmiert und trainiert werden. Es kommt also immer zu irgendeiner Form von Verzerrung bzw. Bias, da der Mensch nicht wertefrei agieren kann. Wie stark ausgeprägt die Bias sind, hängt also von den zum Antrainieren genutzten Datensätzen ab (die Qualität des Input bestimmt die Qualität des Outputs).

Was können Sie gegen Bias tun?

Es gibt unterschiedliche Stellen, an denen Sie beim Kampf gegen Bias ansetzen können:

  • Die Definition des gewünschten Outputs der KI
  • Der Bereitstellung der Datensätze zur Entscheidungsfindung der KI
  • Die durch den*die Programmierer*in vorgegeben Variablen
  • Die Datensätze, die zum Anlernen der KI genutzt werden

Jedoch sollte Ihnen klar sein, eine KI gänzlich ohne Bias zu entwickeln und zu betreiben ist nicht möglich. KI ist menschengemacht und der Mensch ist in seinem Handeln niemals wertfrei – deshalb kann auch die KI nicht komplett wertfrei sein.

Definition des gewünschten Outputs

Ein wichtiger Bestandteil des Entwicklungsprozesses einer KI ist die Definition des gewünschten Outputs/des Ziels. Eine fälschliche oder ungenaue Beschreibung des Outputs kann schwerwiegende Folgen haben. Beispielsweise könnte es im (digitalen) Gesundheitswesen fatal sein, wenn ein Algorithmus, mit den Ziel der Kostenoptimierung programmiert wird, oder ein Algorithmus Entscheidungen basierend auf der Überlebenschance trifft und so eine ungewollte Triage vornimmt.

Es ist also wichtig genau zu beschreiben, was das Ziel der KI ist und was sie am Ende tun soll.

Die richtige Datenbasis bereitstellen

Eine weitere wichtige Stellschraube ist die Datenbasis, die von der KI genutzt wird. Denn, mit nicht hinreichenden definierten oder falsch ausgewählten Datensätzen können ebenfalls Bias entstehen. Ein Beispiel ist die Nutzung von historischen Datensätzen zur Identifizierung geeigneter Arbeitnehmender für Führungspositionen. Da Frauen in der Vergangenheit eher selten die Position einer Führungskraft übernommen haben, sind sie in den historischen Daten deutlich unterrepräsentiert. Daraus könnte die KI ableiten, dass Frauen für Führungspositionen weniger gut geeignet sind als Männer und diese dann aussortieren und somit diskriminieren.

Durch den Programmierenden vorgegebene Variablen

Die programmierende Person eines Algorithmus gibt immer Variablen vor, die in Betracht gezogen werden sollen. Bleiben wir bei dem obigen Beispiel von der KI zur Selektion von geeigneten Arbeitnehmenden für Führungspositionen. Damit Frauen von der KI nicht als solche identifiziert werden und das Geschlecht keine Rolle bei der Auswahl spielt, gibt der*die Programmierer*in an, dass die Variable „Geschlecht“ nicht in Betracht gezogen werden soll. Diese zuerst sinnvoll erscheinende Entscheidung ist jedoch problematisch, da dass System Proxys nutzt und so Frauen trotzdem als solche identifizieren kann, um sie dann als ungeeignet auszuschließen. So diskriminiert das System während der Anwendung.

Die Relevanz von Trainingsdaten

Bias können neben einem unzureichend spezifizierten Ziel und falsch gesetzten Variablen auch durch mangelnde Testdatensätze entstehen. Diese Trainingsdatensätze sind wichtig, da sie die KI anlernen und diese später basierend auf dem Gelernten Entscheidungen trifft. Bei der Auswahl der Trainingsdaten ist es wichtig, neben Quantität und Qualität auch auf die Diversität der Daten zu achten. Warum die Diversität der Daten so wichtig ist, zeigt folgendes Beispiel: Eine KI soll Männer und Frauen anhand von Bildern unterscheiden. Dafür wird sie mit Datensätzen trainiert, bei denen Frauen lange Haare haben. Dadurch werden Frauen mit Kurzhaarfrisuren von der KI als Mann eingestuft, da die Mehrzahl der Männer ebenfalls kurze Haare hat. Deshalb ist es wichtig die KI mit möglichst unterschiedlichen Daten zu trainieren, damit sie sicher die richtige Entscheidung trifft.

Fazit

Es wird deutlich, dass es unterschiedliche Möglichkeiten gibt, KI-Bias zu reduzieren, wenngleich der komplette Ausschluss von Bias nicht möglich ist. Besonders wichtig sind die genaue Definition des gewünschten Outputs, die Bereitstellung der richtigen Datenbasis, die richtige Einstellung von Variablen beim Programmieren des Algorithmus und die Auswahl von qualitativ und quantitativ hochwertigen Trainingsdaten, die so vielfältig wie möglich sind.

SCHLAGWORTE

KI