Was sind LLMs?
LLMs („Large Language Models“) sind Programme, die Texte verstehen und generieren können. Sie helfen, Informationen zu verarbeiten, Antworten zu geben oder Texte zusammenzufassen. Im Unternehmen können sie Prozesse beschleunigen – aber nur, wenn Datenschutz und Datensicherheit von Anfang an mitgedacht werden.
Datenschutz und Datenminimierung
Die DSGVO und die Empfehlungen des Europäischen Datenschutzausschusses (EDPB) machen klar: Nur so viele Daten wie nötig verwenden („Datenminimierung“). Persönliche Daten sollten möglichst gar nicht an ein LLM übergeben werden. Man sollte vor jeder Nutzung prüfen, welche Daten wirklich gebraucht werden – und alles entfernen, was nicht zwingend notwendig ist.
- Vor dem Start: Datenarten und -quellen prüfen
- Unnötige oder sensible Daten aussortieren
- Verarbeitung dokumentieren
Anonymisierung & Privacy-Enhancing Technologies
Die EDPB empfiehlt verschiedene Methoden, um personenbezogene Daten zu schützen, bevor sie an ein LLM gehen:
- Maskierung & Pseudonymisierung: Namen, Adressen und andere Identifikatoren werden durch Platzhalter oder Codes ersetzt. So bleibt der Kontext erhalten, aber die Person ist nicht mehr erkennbar.
- Differential Privacy: Statistische Methoden sorgen dafür, dass einzelne Personen nicht aus den Daten herausgelesen werden können – auch nicht durch Kombination mit anderen Informationen.
- Automatische Erkennung sensibler Daten: Tools erkennen und entfernen personenbezogene Daten, bevor sie verarbeitet werden.
- Technische Schnittstellen: Nur geprüfte, bereinigte Daten werden an das LLM weitergegeben.
Die Kombination dieser Methoden – angepasst an den jeweiligen Anwendungsfall – ist laut EDPB der beste Weg, um Datenschutz und Funktionalität zu verbinden (EDPB, 2025).
Machine Unlearning: Daten wieder entfernen
Ein wichtiger Punkt aus dem EDPB-Dokument: Unternehmen müssen in der Lage sein, Daten aus einem LLM wieder zu entfernen („Machine Unlearning“). Das bedeutet, dass auf Wunsch einer betroffenen Person deren Daten aus dem System gelöscht werden können – auch wenn sie schon für das Training genutzt wurden. Dies ist technisch anspruchsvoll, aber für die Einhaltung der Betroffenenrechte zentral.
- Prozesse für Löschanfragen einrichten
- Technologien für „Unlearning“ prüfen und ggf. implementieren
- Alle Schritte dokumentieren
Integration
LLMs lassen sich in viele Systeme einbauen. Wichtig ist, dass alle Schnittstellen und Prozesse so gestaltet sind, dass keine personenbezogenen Daten durchrutschen. In der Praxis heißt das:
- Automatische Maskierung und Filterung vor jeder Übergabe
- Regelmäßige Audits und Überprüfungen
- Schulungen für Mitarbeitende zu Datenschutz und Anonymisierung
- Dokumentation aller Datenflüsse und -verarbeitungen
Fazit & Ausblick
LLMs bieten viele Chancen, aber Datenschutz bleibt Pflicht. Die Empfehlungen der EDPB (2025) zeigen: Mit Datenminimierung, Anonymisierung, Privacy-Enhancing Technologies und Machine Unlearning lassen sich moderne KI-Lösungen sicher und rechtskonform nutzen.
Bereit mit uns zu wachsen? Kontaktiere deinen Experten
Wir helfen dir dabei diese Methoden umzusetzen, um nicht nicht nur die Daten zu schützen, sondern auch das Vertrauen deiner Nutzer.