Erklärbare KI (XAI) Erklärt

Wichtige erklärungsbedürftige AI-Techniken in der Computer Vision

Anwendungen von erklärbarer KI in der Computer Vision

Die wichtigsten Erkenntnisse über erklärbare KI

Haben Sie schon einmal eine Antwort von einer künstlichen Intelligenz (KI) wie ChatGPT gesehen und sich gefragt, wie sie zu dieser Schlussfolgerung gekommen ist? Dann kennen Sie das Problem der "Black Box" der KI. Dieser Begriff bezieht sich auf die Unklarheit darüber, wie KI-Modelle Daten verarbeiten und analysieren. Selbst für KI-Ingenieure und -Wissenschaftler, die regelmäßig mit hochmodernen KI-Algorithmen arbeiten, ist es oft schwierig, deren Funktionsweise vollständig zu verstehen. Tatsächlich verstehen nur 22 % der IT-Fachleute die Fähigkeiten von KI-Tools wirklich.

Die Ungewissheit darüber, wie KI-Modelle Entscheidungen treffen, kann riskant sein, insbesondere in kritischen Bereichen wie der Computer Vision im Gesundheitswesen und der KI im Finanzwesen. Es werden jedoch erhebliche Fortschritte erzielt, um diese Herausforderungen zu bewältigen und die Transparenz zu verbessern.

Insbesondere die erklärbare KI (XAI) konzentriert sich ausschließlich auf die Lösung dieses Problems. Einfach ausgedrückt handelt es sich um eine Reihe von Prozessen und Methoden, die menschlichen Nutzern helfen, die Ergebnisse komplexer maschineller Lernalgorithmen zu verstehen und ihnen zu vertrauen.

XAI kann Entwicklern helfen sicherzustellen, dass KI-Systeme wie erwartet funktionieren. Außerdem kann sie KI-Unternehmen helfen, regulatorische Standards zu erfüllen. In diesem Artikel befassen wir uns mit erklärungsbedürftiger KI und ihrer breiten Palette von Anwendungsfällen. Fangen wir an!

Die Bedeutung von erklärbarer KI

Bei der Arbeit mit KI ist Erklärbarkeit der Schlüssel. Dies gilt insbesondere für den Teilbereich der KI, die Computer Vision, die in Anwendungen in Branchen wie dem Gesundheitswesen weit verbreitet ist. Bei der Verwendung von Bildverarbeitungsmodellen in solch sensiblen Branchen ist es wichtig, dass die Funktionsweise des Modells für jeden transparent und interpretierbar ist.

Die Interpretierbarkeit von Computer-Vision-Modellen hilft den Nutzern, besser zu verstehen, wie eine Vorhersage gemacht wurde und welche Logik dahinter steckt. Die Transparenz trägt dazu bei, indem sie die Funktionsweise des Modells für jeden verständlich macht, indem sie die Grenzen des Modells klar umreißt und sicherstellt, dass die Daten nach ethischen Grundsätzen verwendet werden. Computer Vision kann beispielsweise Radiologen helfen, gesundheitliche Komplikationen auf Röntgenbildern effizient zu erkennen.

__wf_reserved_inherit — Abb. 1. Mit Vision AI analysierte Röntgenbilder des Brustkorbs mit den Klassifizierungen gesund, krank, aktiv und latent tuberkulös.

‍

Ein Bildverarbeitungssystem, das einfach nur genau ist, reicht jedoch nicht aus. Das System muss auch in der Lage sein, seine Entscheidungen zu erklären. Angenommen, das System könnte zeigen, welche Teile des Bildes zu seinen Schlussfolgerungen geführt haben - dann wären alle Ergebnisse klarer. Ein solches Maß an Transparenz würde den Medizinern helfen, ihre Ergebnisse zu überprüfen und sicherzustellen, dass die Patientenversorgung den medizinischen Standards entspricht.

Ein weiterer Grund, warum Erklärbarkeit wichtig ist, ist, dass sie KI-Unternehmen zur Verantwortung zieht und das Vertrauen der Nutzer stärkt. Vertrauenswürdige KI führt dazu, dass die Nutzer darauf vertrauen, dass KI-Innovationen zuverlässig funktionieren, faire Entscheidungen treffen und verantwortungsvoll mit Daten umgehen.

Wichtige erklärungsbedürftige AI-Techniken in der Computer Vision

Nachdem wir nun erörtert haben, warum Erklärbarkeit in der Computer Vision wichtig ist, wollen wir einen Blick auf die wichtigsten XAI-Techniken werfen, die in der Vision AI eingesetzt werden.

Salienzkarten

Neuronale Netze sind Modelle nach dem Vorbild des menschlichen Gehirns, die Muster erkennen und Entscheidungen treffen, indem sie Daten durch miteinander verbundene Schichten von Knoten (Neuronen) verarbeiten. Sie können zur Lösung komplexer Bildverarbeitungsprobleme mit hoher Genauigkeit eingesetzt werden. Trotz dieser Genauigkeit sind sie von ihrer Konzeption her immer noch Black Boxes.

Salienzkarten sind eine XAI-Technik, die dazu beitragen kann, dass neuronale Netze bei der Analyse von Bildern einen Sinn erkennen. Sie können auch zur Fehlersuche bei Modellen verwendet werden, die nicht die erwartete Leistung erbringen.

Salienzkarten funktionieren, indem sie sich darauf konzentrieren, welche Teile eines Bildes (Pixel) die Vorhersagen eines Modells definieren. Dieser Prozess ist der Backpropagation sehr ähnlich, bei der das Modell von den Vorhersagen auf die Eingabe zurückgreift. Aber anstatt die Gewichte des Modells auf der Grundlage von Fehlern zu aktualisieren, betrachten wir nur, wie viel jedes Pixel für die Vorhersage "wichtig" ist. Salienzkarten sind für Computer-Vision-Aufgaben wie die Bildklassifizierung sehr nützlich.

Wenn beispielsweise ein Bildklassifizierungsmodell vorhersagt, dass es sich bei einem Bild um einen Hund handelt, können wir uns die Salienzkarte ansehen, um zu verstehen, warum das Modell glaubt, dass es sich um einen Hund handelt. Dies hilft uns zu erkennen, welche Pixel die Ausgabe am meisten beeinflussen. Die Saliency Map würde alle Pixel hervorheben, die zu der endgültigen Vorhersage, dass es sich bei dem Bild um einen Hund handelt, beigetragen haben.

‍

Zuordnung der Klassenaktivierung (CAM)

Class Activation Mapping ist eine weitere XAI-Technik, die verwendet wird, um zu verstehen, auf welche Teile eines Bildes sich ein neuronales Netz konzentriert, wenn es Vorhersagen zur Bildklassifizierung trifft. Sie funktioniert ähnlich wie die Saliency Maps, konzentriert sich aber auf die Identifizierung wichtiger Merkmale im Bild und nicht auf bestimmte Pixel. Merkmale sind Muster oder Details, wie Formen oder Texturen, die das Modell im Bild erkennt.

Methoden wie Gradient Weighted Class Activation Mapping (Grad-CAM) und Grad-CAM++ basieren auf der gleichen Idee, mit einigen Verbesserungen.

CAM funktioniert folgendermaßen:

Bevor das neuronale Netz seine endgültige Entscheidung trifft, verwendet es einen Schritt namens Global Average Pooling (GAP), um die Informationen zu vereinfachen. GAP fasst alle Pixel eines erkannten Musters zu einem einzigen Durchschnittswert zusammen und erstellt eine Zusammenfassung für jede Merkmalskarte (eine visuelle Darstellung der erkannten Muster).
‍
Jede Merkmalskarte erhält dann eine Gewichtung, die angibt, wie wichtig sie für die Vorhersage einer bestimmten Klasse (wie "Vogel" oder "Katze") ist.
‍
Eine Einschränkung von CAM ist jedoch, dass Sie das Modell neu trainieren müssen, um diese Gewichte zu berechnen, was zeitaufwändig sein kann.

Grad-CAM verbessert dies durch die Verwendung von Gradienten, die wie Signale zeigen, wie stark jede Merkmalskarte die endgültige Vorhersage beeinflusst. Diese Methode macht GAP überflüssig und macht es einfacher zu sehen, worauf sich das Modell konzentriert, ohne dass es neu trainiert werden muss. Grad-CAM++ geht noch einen Schritt weiter, indem es sich nur auf die positiven Einflüsse konzentriert, was die Ergebnisse noch deutlicher macht.

‍

Kontrafaktische Erklärungen

Kontrafaktische Erklärungen sind ein wichtiges Element der erklärbaren KI. Bei einer kontrafaktischen Erklärung wird eine Situation oder ein Ergebnis beschrieben, indem alternative Szenarien oder Ereignisse betrachtet werden, die nicht eingetreten sind, aber hätten eintreten können. Sie kann aufzeigen, wie Veränderungen bestimmter Eingangsvariablen zu unterschiedlichen Ergebnissen führen, wie z. B.: "Wenn X nicht passiert wäre, wäre Y nicht eingetreten".

Im Bereich der künstlichen Intelligenz und des Computersehens bezeichnet eine kontrafaktische Erklärung die kleinste Änderung, die an einer Eingabe (z. B. einem Bild oder Daten) vorgenommen werden muss, damit ein KI-Modell ein anderes, spezifisches Ergebnis liefert. So könnte beispielsweise die Änderung der Farbe eines Objekts in einem Bild die Vorhersage eines Bildklassifizierungsmodells von "Katze" auf "Hund" ändern.

Ein weiteres gutes Beispiel wäre die Änderung des Blickwinkels oder der Beleuchtung bei einem Gesichtserkennungssystem. Dies könnte dazu führen, dass das Modell eine andere Person identifiziert, was zeigt, wie kleine Änderungen der Eingabe die Vorhersagen des Modells beeinflussen können.

Die einfachste Art, diese Erklärungen zu erstellen, ist das Ausprobieren: Sie können Teile der Eingabe (wie Merkmale des Bildes oder der Daten) zufällig ändern, bis das KI-Modell das gewünschte Ergebnis liefert. Andere Methoden umfassen modellagnostische Ansätze, die Optimierungs- und Suchtechniken verwenden, um Änderungen zu finden, und modellspezifische Ansätze, die sich auf interne Einstellungen oder Berechnungen stützen, um die erforderlichen Änderungen zu ermitteln.

Anwendungen von erklärbarer KI in der Computer Vision

Nachdem wir nun erforscht haben, was XAI ist und welche Schlüsseltechniken es gibt, können wir uns nun ansehen, wie es im wirklichen Leben eingesetzt wird. XAI hat vielfältige Anwendungen in vielen Bereichen. Lassen Sie uns in einige Anwendungsfälle eintauchen, die ihr Potenzial verdeutlichen:

Sicherheitssysteme: XAI kann zur Verbesserung von Sicherheitssystemen eingesetzt werden, indem gemorphte Bilder in Ausweisdokumenten wie Pässen und Führerscheinen erkannt werden. Dies gewährleistet die Authentizität der Bilder, stärkt die Identitätsüberprüfungsprozesse und verhindert betrügerische Aktivitäten in sensiblen Anwendungen.

‍

Autonomes Fahren: Die Fähigkeiten und Grenzen des Vision AI-Systems eines selbstfahrenden Autos zu verstehen, kann ein wichtiger Bestandteil der Tests sein, bevor das Auto auf realen Straßen zum Einsatz kommt. XAI kann Autoherstellern helfen, Probleme klarer zu erkennen und anzugehen.

Rechtssysteme: Bildverarbeitungsgestützte Systeme zur Dokumentenanalyse werden zunehmend bei der Entscheidungsfindung in der Justiz eingesetzt. XAI unterstützt faire Ergebnisse und ermöglicht es, automatisierte Urteile zu hinterfragen. Außerdem hilft es Juristen zu verstehen, wie ein KI-Modell zu seinen Entscheidungen kommt.
‍
Überwachung von Wildtieren: Kamerafallen werden häufig zur Überwachung von Wildtieren und zur Erfassung von Daten über Tierarten eingesetzt. Mit XAI kann erklärt werden, wie KI diese Arten auf den Bildern klassifiziert. Auf diese Weise können Naturschutzbemühungen zuverlässiger und genauer sein.

Die wichtigsten Erkenntnisse über erklärbare KI

Erklärbare KI macht es einfacher zu verstehen, wie KI-Systeme funktionieren und warum sie bestimmte Entscheidungen treffen. Transparenz über KI-Modelle schafft Vertrauen und Verantwortlichkeit. Wissen ist Macht und hilft, KI-Innovationen verantwortungsvoller zu nutzen. In kritischen Bereichen wie Gesundheitswesen, Sicherheit, autonomes Fahren und Rechtssysteme kann XAI Entwicklern und Nutzern helfen, KI-Vorhersagen zu verstehen, Fehler zu erkennen und eine faire und ethische Nutzung sicherzustellen. Indem sie KI transparenter macht, überbrückt XAI die Kluft zwischen Technologie und menschlichem Vertrauen und macht sie für reale Anwendungen sicherer und zuverlässiger.

Um mehr zu erfahren, besuchen Sie unser GitHub-Repository und beteiligen Sie sich an unserer Community. Entdecken Sie KI-Anwendungen für selbstfahrende Autos und die Landwirtschaft auf unseren Lösungsseiten. 🚀

Alles, was Sie über erklärbare KI (XAI) wissen müssen

Die Bedeutung von erklärbarer KI