KI im Unternehmen einführen, ohne die DSGVO zu reißen: die fünf Entscheidungen, die wirklich zählen
2021 habe ich mir selbst ein Versprechen gegeben: KI setze ich nur DSGVO-konform ein. Punkt. Das klang damals nach einer einfachen Entscheidung. Was ich nicht wusste: Wie oft ich in den Jahren danach erleben würde, dass genau diese Frage Projekte zum Stillstand bringt.
Denn so laufen viele Gespräche, die ich führe: Ein Unternehmen will KI einsetzen. Die Geschäftsführung ist überzeugt, das Team hat Ideen, ein Pilotprojekt ist skizziert. Und dann sagt jemand den einen Satz, der alles einfriert: „Aber was ist eigentlich mit dem Datenschutz?" Ab da passiert – nichts mehr. Monatelang.
Wer von euch kennt diese Situation auch:
- Das KI-Projekt liegt auf Eis, weil niemand die Datenschutzfrage abschließend beantworten kann?
- Die Mitarbeiter nutzen längst ChatGPT, nur eben heimlich und mit Kundendaten?
- Der Datenschutzbeauftragte sagt „schwierig", aber niemand kann sagen, was konkret zu tun wäre?
Ich schreibe diesen Artikel, weil ich glaube, dass diese Lähmung unnötig ist. DSGVO-konforme KI ist kein Hexenwerk und auch kein Fall für hundertseitige Gutachten. Es sind im Kern fünf Architektur-Entscheidungen. Und das Schöne daran: Die meisten fallen, bevor die erste Zeile Code geschrieben ist. Man muss sie nur bewusst treffen, statt sie dem Zufall zu überlassen.
Entscheidung 1: Wo läuft das Modell?
Das ist die Grundsatzfrage, und sie wird fast immer übersprungen. Es gibt drei Wege: die großen US-Cloud-APIs (OpenAI, Anthropic, Google), europäische Cloud-Anbieter mit EU-Hosting – oder ein lokales Modell auf eigener Infrastruktur.
Alle drei können DSGVO-konform sein. Ja, auch die US-APIs – mit Auftragsverarbeitungsvertrag, EU-Endpoints und dem Data Privacy Framework ist da vieles möglich, was 2023 noch heikel war. Aber „kann konform sein" heißt: Es hängt davon ab, was ihr durch das Modell schickt. Und genau deshalb ist das keine Juristen-Entscheidung, sondern eine Architektur-Entscheidung.
Ich habe für meine eigene KI-Assistentin Lea damals bewusst auf einen Server in Deutschland gesetzt und arbeite bis heute viel mit lokalen Modellen auf Hetzner-Servern. Nicht aus Prinzipienreiterei, sondern weil es eine Kategorie von Daten gibt, bei der ich die Diskussion gar nicht erst führen will: Gesundheitsdaten, Personaldaten, alles Besondere nach Artikel 9. Für einen Kundenservice-Assistenten, der öffentliche Produktinfos beantwortet? Da ist eine Cloud-API völlig in Ordnung und schlicht wirtschaftlicher.
Mein Rat: Nicht „Cloud oder lokal?" fragen, sondern „welche Daten wohin?". Die Antwort ist fast nie ein Entweder-oder.
Entscheidung 2: Was bekommt das Modell zu sehen?
Hier passieren die wirklichen Datenschutzverstöße – nicht im Modell, sondern davor. Die DSGVO kennt ein Prinzip namens Datenminimierung, und es ist für KI-Projekte Gold wert: Das Modell braucht nur die Daten, die es für die konkrete Aufgabe wirklich benötigt.
Ein Beispiel aus der Praxis: Ein Unternehmen will E-Mails automatisch kategorisieren. Der naive Ansatz schickt die komplette E-Mail ans Modell – mit Namen, Signatur, Telefonnummer, manchmal ganzen Vertragsdetails im Anhang. Der durchdachte Ansatz pseudonymisiert vorher: Namen werden durch Platzhalter ersetzt, bevor der Text das Haus verlässt, und nach der Antwort wieder eingesetzt. Das ist ein überschaubarer technischer Baustein, der aus einem heiklen Projekt ein sauberes macht.
Noch wichtiger wird das bei RAG-Systemen, also wenn die KI auf eure internen Dokumente zugreift. Die Frage ist dann nicht mehr nur „was schicken wir ans Modell?", sondern „wer darf über die KI auf welche Dokumente zugreifen?". Wenn der Praktikant über den Chatbot Gehaltslisten abfragen kann, weil die Vektor-Datenbank keine Zugriffsrechte kennt, habt ihr kein KI-Problem – ihr habt ein Berechtigungsproblem mit KI-Verstärker.
Entscheidung 3: Wo landen die Daten danach?
Das ist die Entscheidung, die am häufigsten vergessen wird, weil sie unsichtbar ist. Ein LLM-Aufruf ist keine Einbahnstraße: Da sind Logs beim Anbieter, Trainingsdaten-Opt-outs, die man aktiv setzen muss, Chatverläufe, die irgendwo gespeichert werden, und bei Agenten-Systemen ganze Gesprächshistorien auf Servern, an die seit Monaten niemand mehr gedacht hat.
Ich nehme mich da nicht aus. Als ich anfing, KI-Agenten in meinem Alltag laufen zu lassen, hatte ich anfangs kein durchdachtes Konzept dafür, welche Daten sich wo ansammeln. Erst als ich tiefer in die Sicherheitsseite eingestiegen bin, wurde mir klar, wie groß dieser blinde Fleck bei den meisten Setups ist – meinem eigenen eingeschlossen.
Konkret heißt das: Trainingsnutzung beim Anbieter deaktivieren, Log-Aufbewahrung klären, Löschkonzept für Chatverläufe definieren. Klingt trocken, ist aber in Summe ein Nachmittag Arbeit – wenn man es am Anfang macht. Nachträglich ist es Archäologie.
Entscheidung 4: Was darf die KI tun – nicht nur sehen?
Spätestens seit KI-Agenten E-Mails verschicken, Termine buchen und auf Systeme zugreifen, reicht die Frage „welche Daten sieht das Modell?" nicht mehr. Die neue Frage lautet: Welche Berechtigungen hat das System? Ein Chatbot, der antwortet, ist eine andere Risikoklasse als ein Agent, der handelt.
Das Prinzip ist dasselbe wie bei menschlichen Mitarbeitern: so viele Rechte wie nötig, so wenige wie möglich. Ein Agent, der Rechnungen kategorisiert, braucht keinen Schreibzugriff aufs CRM. Klingt selbstverständlich – aber ich weiß aus eigener Erfahrung, wie schnell man dem System „mal eben" die nächste Berechtigung gibt, weil es gerade praktisch ist. Genau diese Bequemlichkeit ist der Moment, in dem aus einem Datenschutz-Thema ein Sicherheitsvorfall wird.
Entscheidung 5: Wer trägt die Verantwortung – auf dem Papier und im Alltag?
Die unbequeme Wahrheit zuerst: Auch mit perfekter Technik bleibt Papierkram. Auftragsverarbeitungsverträge mit den KI-Anbietern, der Eintrag im Verarbeitungsverzeichnis, bei größeren Vorhaben eine Datenschutz-Folgenabschätzung. Und seit der EU AI Act schrittweise scharf geht, kommt eine zweite Ebene dazu, die mit der DSGVO verzahnt gehört, statt getrennt abgearbeitet zu werden.
Aber das eigentlich Wichtige an dieser Entscheidung ist nicht das Papier – es sind die Menschen. Eure Mitarbeiter nutzen KI. Jetzt schon. Die Frage ist nur, ob mit klaren Leitplanken oder heimlich mit dem privaten ChatGPT-Account und echten Kundendaten. Eine KI-Nutzungsrichtlinie, die auf zwei Seiten sagt, was erlaubt ist und was nicht, verhindert mehr Datenschutzverstöße als jede technische Maßnahme. Verbieten funktioniert übrigens nicht – das verlagert die Nutzung nur ins Verborgene, wo ihr sie weder seht noch steuern könnt.
Warum ich das alles zusammendenke
Vielleicht ist euch aufgefallen, dass keine dieser fünf Entscheidungen eine reine Juristen-Frage ist. Genau das ist mein Punkt: Wer KI DSGVO-konform einsetzen will, braucht jemanden, der beides versteht – die Technik, die gebaut wird, und die Regulierung, die sie absichert. Ein Anwalt kann euch sagen, dass Pseudonymisierung hilft. Aber er baut euch keine Pipeline, die das macht. Ein KI-Entwickler baut euch die Pipeline – aber weiß oft nicht, dass er sie braucht.
Deshalb gibt es bei mir KI-Implementierung und Compliance nicht als getrennte Welten, sondern als eine Aufgabe. Nicht weil es sich gut verkauft, sondern weil es technisch gar nicht anders geht: Die Datenschutz-Entscheidungen sind Architektur-Entscheidungen. Wer sie am Anfang trifft, baut einmal und baut richtig. Wer sie ans Ende schiebt, baut zweimal.
Ich möchte ehrlich sein: Auch mit diesen fünf Entscheidungen ist nicht jeder Fall trivial, und ich lerne selbst in jedem Projekt dazu. Aber die Lähmung, mit der viele Unternehmen vor dem Thema stehen – die ist unnötig.
Wenn euer KI-Projekt gerade an der Datenschutzfrage festhängt oder ihr wissen wollt, wie diese Entscheidungen für euren konkreten Fall aussehen: Sprecht mich an, schreibt mir eine E-Mail oder ruft einfach an. Lasst uns das gemeinsam sortieren – meistens ist es weniger kompliziert, als es sich anfühlt.
Artikel teilen
Wollen Sie KI sinnvoll einsetzen?
Beratung, Coaching und Implementierung — von der Strategie bis zum produktiven System.
KI-Projekt besprechen