L’IA ne retient pas ses erreurs :Corrigez ChatGPT, Claude ou Gemini : l’IA s’excuse, reformule, et vous donne la bonne réponse. Reposez la même question le lendemain : elle commettra la même erreur. Non pas par mauvaise volonté, mais parce qu’un modèle de langage n’apprend pas de ses conversations. Il n’apprend qu’au moment de son réentraînement, entre deux versions. Cette réalité technique, souvent ignorée, pose des questions profondes sur la conformité de ces systèmes au RGPD.
Comment fonctionne réellement un LLM
Pour comprendre l’enjeu, il faut d’abord saisir une réalité technique. Un modèle de langage (LLM) comme ChatGPT, Claude ou Mistral n’est pas une base de données. C’est un réseau de neurones composé de milliards de paramètres numériques, entraîné sur d’énormes corpus de textes. Lors de cet entraînement, les données (y compris des données personnelles) sont « disséminées » dans ces paramètres. Elles ne sont plus stockées de manière identifiable ou localisable. Elles ont influencé des poids statistiques.
C’est une différence fondamentale avec un système classique. Dans une base de données relationnelle, on peut localiser un enregistrement, le modifier, le supprimer. Dans un LLM, c’est comme demander à une personne d’oublier précisément l’influence qu’un livre particulier a eue sur sa façon de penser. Techniquement quasi impossible.
Quand un utilisateur corrige le modèle en cours de conversation, cette correction n’existe que dans le contexte de l’échange en cours. Elle s’évapore à la session suivante. Le modèle ne s’améliore qu’au changement de version, si et seulement si les retours ont été intégrés dans le processus de réentraînement. Et même dans ce cas, la correction bénéficie à tout le monde, pas spécifiquement à la personne qui l’a signalée.
on est d’accord, on peut avoir la chance qu’elle le stocker en memoire, mais pas evident.
Les droits des personnes à l’épreuve du réel
Le RGPD a été conçu pour des systèmes où les données sont stockées, identifiables, modifiables et supprimables. Les droits des personnes concernées reposent entièrement sur cette logique. Examinons leur effectivité réelle face à un LLM.
Le droit de rectification (article 16)
C’est le droit qui illustre le mieux le problème. L’article 16 du RGPD confère à toute personne le droit d’obtenir la rectification de données inexactes la concernant. Or, lorsqu’un utilisateur corrige une erreur factuelle produite par un LLM, rien ne change dans le modèle. La « rectification » n’existe que dans le contexte de la conversation. Le modèle continuera de produire la même erreur pour tout le monde, jusqu’à un éventuel réentraînement dont la date et le contenu sont incertains.
Le responsable de traitement peut-il raisonnablement prétendre respecter l’article 16 alors que, structurellement, la correction ne peut pas être effective de manière immédiate ni même certaine ?
Le droit d’effacement (article 17)
Le droit à l’oubli pose un problème encore plus profond. Comment effacer une donnée personnelle qui a été absorbée dans un réseau de neurones composé de milliards de paramètres ? La donnée n’existe plus en tant que telle : elle a modifié des poids numériques parmi des milliards d’autres.
La Garante italiana per la protezione dei dati personali a été la première autorité européenne à se saisir de ce sujet, en ordonnant la suspension temporaire de ChatGPT en mars 2023. OpenAI a répondu en mettant en place des filtres de sortie pour éviter que le modèle ne régurgite certaines données personnelles. Mais le modèle lui-même n’a pas été purgé. Il s’agit d’un cache-misère technique, pas d’un effacement au sens du RGPD.
Le droit d’accès (article 15)
Le droit d’accès suppose que le responsable de traitement puisse restituer les données personnelles qu’il détient sur une personne. Or un LLM ne « détient » pas de données sous forme structurée. Si on lui demande ce qu’il « sait » sur une personne, il peut générer des informations qui semblent exactes, qui le sont parfois, mais qui sont parfois totalement hallucinées. Il est impossible de distinguer de façon fiable les données réellement issues de l’entraînement des fabrications du modèle.
Comment garantir un droit d’accès pertinent quand le système est structurellement incapable de déterminer lui-même quelles données il détient ?
Le droit d’opposition (article 21) et la décision automatisée (article 22)
Un modèle entraîné sur des données contre lesquelles une personne s’oppose continue de les exploiter indirectement à chaque inférence. L’opposition peut être formellement enregistrée par l’éditeur, mais elle est matériellement sans effet sur le modèle en production. L’impact des données personnelles concernées persiste dans les paramètres jusqu’au prochain cycle de réentraînement, voire au-delà si ces données ne sont pas explicitement exclues.
Quant à l’article 22, la question se pose dès lors qu’un LLM est utilisé pour produire des évaluations, des recommandations ou des synthèses sur lesquelles s’appuient des décisions affectant des personnes. L’opacité du modèle rend alors l’explication de la logique sous-jacente particulièrement ardue.
La base légale fragilisée
Ce décalage structurel remonte jusqu’à la question de la base légale. La plupart des éditeurs de LLM invoquent l’intérêt légitime (article 6.1.f) comme fondement du traitement de données personnelles lors de l’entraînement. Or cette base légale exige une mise en balance entre l’intérêt du responsable de traitement et les droits et libertés des personnes concernées.
Si les droits des personnes sont structurellement inopérants face au système, la balance est faussée dès le départ. Le contrepoids que représentent les droits des personnes n’est plus un contrepoids réel mais une façade juridique. Cette analyse pourrait conduire à remettre en cause la validité même de la base légale choisie.
Le CEPD, dans son avis 28/2024 sur les modèles d’IA et les données personnelles, a d’ailleurs reconnu que la simple difficulté technique d’extraire des données d’un modèle ne constitue pas une anonymisation au sens du RGPD. Autrement dit, le modèle reste un traitement de données personnelles même si ces données ne sont plus directement accessibles. La CNIL française a adopté une position similaire dans ses recommandations sur l’IA générative publiées en 2024.
L’illusion de la conformité par les filtres de sortie
Face à ces difficultés, les éditeurs ont déployé des mécanismes correctifs : filtres de sortie pour bloquer certaines données personnelles, systèmes de « machine unlearning » pour tenter de désapprendre des informations, et politiques de confidentialité détaillées. Ces mesures sont nécessaires, mais elles ne règlent pas le problème fondamental.
Un filtre de sortie empêche le modèle d’afficher une donnée personnelle, mais cette donnée continue d’influencer les réponses produites. C’est l’équivalent de mettre un rideau devant un problème structurel. Le « machine unlearning », quant à lui, est une technique encore expérimentale dont l’efficacité n’est pas démontrée à l’échelle des modèles actuels. Aucune autorité de protection des données n’a validé ces techniques comme constitutives d’un effacement ou d’une rectification effective.
Conséquences pour l’analyse de conformité
Pour un DPO qui évalue un traitement impliquant un LLM, ces constats imposent une grille d’analyse spécifique.
L’AIPD doit intégrer le risque structurel
L’analyse d’impact relative à la protection des données (AIPD) ne peut pas se contenter d’évaluer les risques classiques. Elle doit mentionner explicitement que les mesures techniques permettant l’exercice des droits sont partielles, voire illusoires pour certains d’entre eux. Le risque résiduel n’est pas un risque marginal, c’est un risque inhérent à la nature même de la technologie.
La transparence comme mesure compensatoire
Si l’effectivité complète des droits ne peut être garantie, la transparence envers les personnes concernées devient d’autant plus cruciale. Les personnes doivent être clairement informées que leurs données, une fois utilisées pour l’entraînement, ne peuvent être ni rectifiées ni effacées de manière immédiate et certaine. Cette transparence est une exigence de l’article 13 du RGPD, mais elle prend ici une dimension particulière : il ne s’agit pas seulement d’informer sur les droits, mais d’informer honnêtement sur leurs limites.
La documentation des mesures compensatoires
Le responsable de traitement doit documenter précisément les mesures mises en œuvre pour pallier l’ineffectivité partielle des droits : nature des filtres de sortie, fréquence des cycles de réentraînement, procédures d’exclusion de données lors des futurs entraînements, recours à des techniques de désapprentissage. Ces mesures doivent être évaluées honnêtement, sans présenter comme effective une protection qui ne l’est que partiellement.
Et pour le DPO qui utilise l’IA comme outil ?
Ce constat ne concerne pas uniquement les éditeurs de LLM. Il intéresse aussi directement le DPO qui utilise une IA générative comme assistant de conformité.
Si l’IA peut donner une réponse juridiquement fausse avec une assurance totale, la corriger, puis reproduire la même erreur le lendemain pour un autre utilisateur, alors elle ne peut jamais être considérée comme une source fiable. L’IA est un accélérateur de rédaction, un outil de brainstorming, un assistant de structuration. Mais la validation juridique reste un travail humain.
C’est précisément là que la valeur du DPO humain est irremplaçable : il corrige, il apprend, il capitalise sur ses erreurs en continu. L’IA, elle, attend sa prochaine version. Et entre deux versions, elle propage ses erreurs à grande échelle, avec une confiance apparente qui les rend d’autant plus dangereuses.



































