Glossar

Datenschutz

Entdecke die wichtigsten Datenschutztechniken für KI/ML, von der Anonymisierung bis zum föderierten Lernen, um Vertrauen, Compliance und ethische KI-Praktiken sicherzustellen.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Der Datenschutz in den Bereichen Künstliche Intelligenz (KI) und Maschinelles Lernen (ML) bezieht sich auf die Grundsätze, Vorschriften und Techniken, die zum Schutz persönlicher und sensibler Daten in KI/ML-Systemen eingesetzt werden. Dabei geht es um die Art und Weise, wie Daten gesammelt, verarbeitet, gespeichert, weitergegeben und gelöscht werden, um Fairness, Transparenz und die individuelle Kontrolle über persönliche Daten zu gewährleisten. Da KI-Modelle, z. B. für die Objekterkennung, oft große Datensätze für das Training benötigen, ist die Umsetzung starker Datenschutzmaßnahmen entscheidend, um das Vertrauen der Nutzer/innen zu gewinnen, rechtliche Verpflichtungen zu erfüllen und ethische Standards einzuhalten. Du kannst den Ansatz von Ultralytics in unserer Datenschutzrichtlinie nachlesen.

Die Bedeutung des Datenschutzes bei KI und maschinellem Lernen

Datenschutz ist bei KI und ML aus mehreren Gründen von grundlegender Bedeutung. Erstens schafft er Vertrauen bei Nutzern und Interessengruppen. Menschen sind eher bereit, sich auf KI-Systeme einzulassen, wenn sie glauben, dass ihre Daten sicher und ethisch korrekt behandelt werden. Zweitens ist der Datenschutz in vielen Ländern gesetzlich vorgeschrieben. Verordnungen wie die General Data Protection Regulation (GDPR) in Europa und der California Consumer Privacy Act (CCPA) setzen strenge Standards für den Umgang mit Daten und sehen bei Verstößen hohe Strafen vor. Die Einhaltung dieser Vorschriften ist für Unternehmen, die KI-Lösungen weltweit einsetzen, unerlässlich. Drittens ist die Wahrung des Datenschutzes ein zentraler Bestandteil der KI-Ethik, der sicherstellt, dass KI-Systeme die Rechte des Einzelnen respektieren und Schaden durch den Missbrauch oder die Preisgabe persönlicher Daten verhindern, was auch die Eindämmung algorithmischer Verzerrungen einschließt. Ein verantwortungsvoller Umgang mit KI ist ein wichtiger Aspekt für Entwickler/innen.

Techniken zur Gewährleistung des Datenschutzes

Um den Datenschutz in KI- und ML-Anwendungen zu verbessern, werden verschiedene Techniken eingesetzt:

  • Anonymisierung und Pseudonymisierung: Mit diesen Techniken werden personenbezogene Daten so verändert, dass Personen nicht mehr leicht identifiziert werden können. Bei der Anonymisierung werden die Identifikatoren unwiderruflich entfernt, während bei der Pseudonymisierung die Identifikatoren durch künstliche ersetzt werden und unter bestimmten Bedingungen eine erneute Identifizierung möglich ist. Anleitungen zu diesen Techniken gibt es von Einrichtungen wie dem britischen Information Commissioner's Office.
  • Differential Privacy: Diese Methode fügt statistisches Rauschen zu Datensätzen oder Abfrageergebnissen hinzu. Sie ermöglicht es Datenanalysten, nützliche Erkenntnisse aus aggregierten Daten zu gewinnen und gleichzeitig mathematisch zu garantieren, dass die Informationen über jede einzelne Person geschützt bleiben. Forschungseinrichtungen wie das Harvard Privacy Tools Project erforschen ihre Anwendungen.
  • Föderiertes Lernen: Mit diesem Ansatz können ML-Modelle auf mehreren dezentralen Geräten oder Servern mit lokalen Datenproben trainiert werden, ohne dass die Rohdaten selbst ausgetauscht werden. Stattdessen werden nur Modellaktualisierungen (z. B. Gradienten) ausgetauscht, was die Risiken für den Datenschutz deutlich verringert. Erfahre mehr in Ressourcen wie dem Google AI Blog über Federated Learning.
  • Homomorphe Verschlüsselung: Diese fortschrittliche kryptografische Technik ermöglicht es, Berechnungen direkt mit verschlüsselten Daten durchzuführen, ohne sie vorher entschlüsseln zu müssen. Sie ist zwar rechenintensiv, bietet aber starke Datenschutzgarantien. Erforsche die Konzepte anhand von Ressourcen wie der Arbeit vonMicrosoft Research zu SEAL.
  • Sichere Mehrparteienberechnung (SMPC): SMPC-Protokolle ermöglichen es mehreren Parteien, gemeinsam eine Funktion über ihre Eingaben zu berechnen und diese Eingaben dabei geheim zu halten. Eine Übersicht findest du auf Wikipedia.

Reale Anwendungen des Datenschutzes in KI/ML

Datenschutztechniken sind für zahlreiche KI/ML-Anwendungen unerlässlich:

  1. Gesundheitswesen: In der KI im Gesundheitswesen schützen Datenschutztechniken sensible Patientendaten beim Training von Modellen für Aufgaben wie die medizinische Bildanalyse oder die Diagnose von Krankheiten. Techniken wie das föderierte Lernen ermöglichen es Krankenhäusern, bei der Modellschulung mit lokalen Patientendaten zusammenzuarbeiten, ohne diese direkt weiterzugeben, was die Einhaltung von Vorschriften wie HIPAA erleichtert. Die Generierung synthetischer Daten ist ein weiterer Ansatz, der hier verwendet wird.
  2. Finanzen: Banken und Finanzinstitute nutzen KI zur Betrugserkennung, Kreditwürdigkeitsprüfung und für personalisierte Dienstleistungen. Datenschutzmethoden wie Anonymisierung und differenzierter Datenschutz helfen dabei, die Finanzdaten der Kunden zu schützen, während sie die Entwicklung dieser KI-gesteuerten Finanztools ermöglichen und die Einhaltung von Standards wie dem Payment Card Industry Data Security Standard (PCI DSS) gewährleisten.

Verwandte Konzepte

Es ist wichtig, zwischen dem Datenschutz und dem verwandten Konzept der Datensicherheit zu unterscheiden.

  • Datenschutz: Konzentriert sich auf die Regeln, Richtlinien und Rechte des Einzelnen in Bezug auf die Erhebung, Verwendung, Speicherung und Weitergabe von personenbezogenen Daten. Dabei geht es um Fragen wie, welche Daten gesammelt werden dürfen, warum sie gesammelt werden, wer darauf zugreifen darf und wie sie angemessen verwendet werden. Zu den wichtigsten Punkten gehören Zustimmung, Transparenz und Zweckbindung.
  • Datensicherheit: Umfasst die technischen und organisatorischen Maßnahmen, die zum Schutz der Daten vor unbefugtem Zugriff, Verstößen, Beschädigung und anderen Bedrohungen getroffen werden. Beispiele sind Verschlüsselung, Firewalls, Zugangskontrollen und Systeme zur Erkennung von Eindringlingen.

Datenschutz und Datensicherheit sind zwar zwei unterschiedliche Dinge, aber sie sind voneinander abhängig. Eine starke Datensicherheit ist eine Voraussetzung für die Gewährleistung des Datenschutzes, denn Datenschutzrichtlinien sind wirkungslos, wenn die Daten nicht angemessen vor Verstößen geschützt sind. Beide sind wesentliche Komponenten für den Aufbau vertrauenswürdiger KI-Systeme und werden oft durch umfassende Praktiken für Machine Learning Operations (MLOps) verwaltet. Organisationen wie das Electronic Privacy Information Center (EPIC) setzen sich für einen starken Schutz der Privatsphäre ein, während Rahmenwerke wie das NIST Privacy Framework eine Anleitung für die Umsetzung bieten.

Alles lesen