Les fondamentaux du ZDR et de la rétention de données

Depuis environ trois ans, un débat silencieux traverse les organisations : comment utiliser l’IA générative sans sacrifier la confidentialité de ses données ? La réponse standard que vous entendez en réunion de direction est « Zero Data Retention » (ZDR). Mais qu’est-ce que c’est vraiment ?

Le ZDR n’est pas un concept magique

Il s’agit simplement d’une garantie contractuelle et architecturale selon laquelle un fournisseur d’IA traite vos données, les utilise pour répondre à votre requête immédiate, puis les supprime irrémédiablement. Pas de stockage, pas de sauvegarde, pas d’archivage « au cas où ». Aucune utilisation ultérieure pour l’amélioration du modèle.

Pour voir toute la valeur de ce concept, il faut contraster avec le fonctionnement de ChatGPT grand public. Lorsque vous tapez une question dans l’interface web gratuite ou Plus, OpenAI retient votre conversation, votre adresse IP, votre localisation, vos patterns d’utilisation. Ces données alimentent directement l’amélioration continue des modèles. D’ailleurs, selon un audit de l’Union européenne datant de 2024, 63 % des données des utilisateurs ChatGPT contiennent des informations personnelles identifiables (PII) : noms, adresses, numéros de téléphone, historiques de navigation. Seuls 22 % des utilisateurs étaient conscients de cette pratique.

Cette distinction entre les modèles fondamentaux (FDM) grand public et les solutions ZDR est précisément ce qui distingue une stratégie de données responsable d’une exposition de risque silencieuse.

Où intervient le ZDR dans l’architecture ?

Dans l’implémentation concrète, le ZDR fonctionne en se connectant directement au système source de vos données au moment de l’exécution. Un cabinet juridique envoie un document protégé à Claude Enterprise avec ZDR activé ? Ce document est traité en mémoire vive, la réponse est générée, puis le document disparaît complètement des serveurs d’Anthropic. Il n’y a pas de copie à récupérer, pas d’archive d’abus monitoring qui pourrait être découverte en cas de litige.

Par contraste, OpenAI (non-ZDR par défaut) retient les conversations à minima 30 jours. Google retient également jusqu’à 18 mois. Anthropic, positionnée comme plus sécurisé, offre le ZDR via contrat et adopte un délai de rétention de 30 jours minimum également, avec toutefois la possibilité de négocier des délais plus courts ou la suppression immédiate pour les clients éligibles.

L’infrastructure du ZDR repose sur cinq piliers architecturaux

Minimalisme des données : accès uniquement aux données strictement nécessaires.
Accès en temps réel, sur place : une connexion directe aux données source au moment de l’exécution, pas d’importation préalable.
Traitement sans état : chaque appel API est atomique et indépendant, sans ID utilisateur par exemple.
Non-rétention vérifiable : l’architecture doit être auditable pour confirmer que les données ne sont jamais conservées.
Séparation données/métadonnées : les logs opérationnels et de conformité sont maintenus (pour les audits), mais les données sensibles elles-mêmes ne sont jamais archivées.

Ce dernier point est crucial car il résout une tension que beaucoup de décideurs trouvent contradictoire : le ZDR n’élimine pas la nécessité des logs de conformité. Par exemple, un hôpital utilisant un assistant IA ZDR avec des patients devra toujours conserver des logs d’accès aux dossiers médicaux pendant 6 à 7 ans pour se conformer à la réglementation. Mais le contenu de ces dossiers, les données sensibles du patient, ne seront jamais persistantes dans les systèmes du fournisseur d’IA.

La dichotomie troublante entre les modèles grand public et entreprise

Imaginez que vous êtes VP Product dans une fintech européenne. Vos équipes demandent d’utiliser ChatGPT pour accélérer la revue d’un contrat client, en toute innocence. Sauf que cette requête contient l’ID bancaire du client, ses revenus, son historique de défaut de paiement. Vous cliquez sur « Envoyer » et ces données disparaissent dans les serveurs d’OpenAI.

Voici le problème : selon la politique standard de ChatGPT (mise à jour en 2025), OpenAI peut retenir cette conversation indéfiniment. D’ailleurs, un jugement fédéral d’octobre 2025 a forcé OpenAI à conserver les données supprimées pour des poursuites judiciaires. Donc, même si vous pensiez avoir supprimé cette conversation, elle est en réalité probablement archivée pour détecter les abus. Sam Altman a par ailleurs indiqué que les données de vos conversations avec ChatGPT peuvent être retenues contre vous dans un procès.

C’est exactement le vide que le ZDR vient combler.

Maintenant, cette même situation avec une alternative ZDR : Elosia avec un modèle ZDR activé. Vous déposez le contrat client. Elosia génère son analyse, vous donne une réponse, puis la requête est définitivement supprimée. Le modèle sélectionné ne pourra pas utiliser votre prompt pour améliorer son modèle. Aucun agent d’abus monitoring ne l’archive en arrière-plan « au cas où ». Cette donnée n’existe que pendant les quelques secondes de son traitement.

Ce n’est pas anodin, c’est une différence importante qui sépare deux visions de l’IA : celle où vos données sont des marchandises (les modèles grand public), et celle où vos données restent les vôtres (les modèles ZDR).

Toutefois, dans la réalité : environ 90 % des organisations rapportent que les coûts de l’IA limitent la valeur qu’elles peuvent en extraire. Les solutions ZDR sont plus chères. Beaucoup plus chères. Anthropic demande une prime pour le ZDR. OpenAI exige des contrats d’entreprise spéciaux et onéreux. Et cette solution ne vaut que si vos données le justifient.

C’est la tension irrésolue : vous voulez protéger vos données, mais le coût du ZDR peut être prohibitif si vous n’êtes pas dans une industrie fortement réglementée. Cela crée une situation troublante où seules les grandes entreprises et les secteurs réglementés peuvent se permettre le ZDR, tandis que les startups et les PME continuent à utiliser ChatGPT grand public et acceptent passivement la rétention des données. C’est là qu’Elosia intervient.

Quand le ZDR est critique vs. quand c’est du bullshit

Maintenant que vous avez les bases, soyons directs : le ZDR n’est pas universellement nécessaire. Et faire croire le contraire serait une arnaque.

Qui DOIT utiliser des solutions ZDR (non-négociable)

1. Organisations de santé et healthtech gérant des données médicales protégées (PHI)

Un hôpital utilisant l’IA pour diagnostiquer des scans ou créer des plans de traitement ? Si ces données arrivent chez OpenAI sans ZDR, le risque de conformité devient extrême. Non pas parce qu’OpenAI va sciemment violer la loi, mais parce qu’aucune forme de rétention temporaire de données médicales n’est légalement acceptable sans contrôles majeurs. Le ZDR transforme cette exposition en non-problème : les données sont traitées et supprimées avant même qu’une question de « rétention pour abus » ne se pose.

2. Services financiers et fintechs manipulant des secrets commerciaux

Un gestionnaire d’actifs utilisant l’IA pour analyser des portefeuilles, des positions, des valorisations, des stratégies à venir : ces informations sont des actifs commerciaux de valeur. Les FDM retenant même temporairement ces données crée une exposition légale et compétitive. Le ZDR élimine cette surface d’attaque économique.

3. Cabinets juridiques, conformité, comptabilité

Les communications entre avocats et clients sont protégées par le secret professionnel. Vous ne pouvez pas légalement laisser une plateforme non-ZDR conserver ces données, même temporairement, sans consentement explicite du client. De nombreux cabinets juridiques utilisent Elosia pour cette raison précise.

4. Organisations publiques ou de défense

Ce n’est même pas un débat. Les données publiques de citoyens exigent généralement une rétention zéro par des tiers non-agréés, point.

Qui n’a PAS BESOIN du ZDR (et paie juste un surcoût inutile)

1. Équipes de marketing générant du contenu créatif

Si vous utilisez ChatGPT pour rédiger une copy de campagne marketing ? Vos idées et votre brief marketing ne sont pas sensibles. Il y a zéro risque de conformité. OpenAI retenant ces données pendant 30 jours ne crée aucune exposition réelle. Le seul intérêt d’utiliser du ZDR ici est de protéger vos créations de potentiel plagiat.

2. Équipes R&D en phase expérimentale

Vous testez un nouveau concept de produit, itérez sur des idées ? Ces données sont rarement sensibles au moment du prototypage. Une fois le produit en marché avec de vraies données clients, c’est différent. Mais pour la phase expérimentale, posez-vous la question de la confidentialité réelle de vos données.

3. Équipes utilisant l’IA pour du support client grand public

Un chatbot de service client utilisant Claude ou OpenAI pour répondre à des questions basiques ? Les données sont généralement non-sensibles (« Comment réinitialiser mon mot de passe ? »). Si 99 % de vos interactions sont publiquement acceptables, le ZDR est un luxe, pas une nécessité.

4. Organisations sans données réglementées ou hautement sensibles

Une startup SaaS B2B sans données financières sensibles, sans PII client concentré, sans secrets commerciaux critiques ? Le ZDR peut être justifié pour une posture de sécurité « premium » auprès des clients, mais c’est une décision marketing, pas de conformité.

Matrice de décision pour le ZDR

Catégorie de données	Sensibilité	Risque de rétention	ZDR requis ?
PHI (santé)	Critique	Très haut (amende = millions €)	OUI
PII financière (revenus, notes de crédit)	Critique	Très haut (vol d’identité, arbitrage de marché)	OUI
Secrets commerciaux / stratégie	Critique	Très haut (avantage concurrentiel perdu)	OUI
Données de clients identifiables	Haute	Moyen-Haut	Probablement
Contenu marketing interne	Faible	Faible	Non
Idées expérimentales / R&D précoce	Faible-Moyen	Faible	Non
Support client standard	Faible	Minimal	Non

Attention cependant : certaines entreprises vous vendent de la peur en jouant sur l’aspect fuite de données. C’est vrai, mais c’est aussi un faux argument pour maximiser la vente de solutions ZDR.

Comment décider et mettre en place

1. Audit des données : cartographiez ce que vous stockez réellement

Avant de discuter du ZDR avec vos fournisseurs d’IA, vous devez répondre à cette question simple : Quelles données envoyez-vous réellement à vos modèles d’IA ?

Cas d’usage IA	Type de données	Sensibilité (1-5)	Volume	Fournisseur cible
Rédaction de contenu marketing	Briefs internes, guidelines de marque	1	Moyen	pas de ZDR
Analyse de contrats	Contrats clients, PII, termes commerciaux	4	Faible	ZDR
Support client IA	Questions standards, données non-sensibles	2	Très haut	pas de ZDR
Analyse de risque financier	Portefeuille client, évaluations de crédit	5	Moyen	ZDR

2. Évaluation de conformité : quelle réglementation s’applique ?

Manipulez-vous des données soumises à la santé, la finance, la GDPR (EU), etc. ? → ZDR fortement recommandé
Vos données incluent-elles du travail protégé par secret professionnel ? → ZDR non-négociable
Avez-vous des secrets commerciaux critiques ? → ZDR justifiable
Traitez-vous des données personnelles (noms + adresses + numéros de compte ensemble) ? → ZDR fortement recommandé

Si vous répondez « non » à plus de deux questions, ZDR n’est probablement pas justifié à pleine échelle.

3. Évaluez le coût : le test du coût-bénéfice

Les solutions ZDR sont souvent plus chères. Anthropic demande une prime pour Claude Enterprise avec ZDR. OpenAI exige des contrats d’entreprise spécialisés (généralement 5×-10× plus chers que l’API standard).

Quel est le coût annuel estimé du ZDR ? (Demandez à vos fournisseurs ; attendez-vous à +30-50k€ par an pour une organisation moyenne.)
Quel est le coût en termes de réputation / légal d’une exposition de données non-ZDR ? Pour une healthtech : des millions. Pour une agence marketing ? Quelques milliers peut-être. Pour un cabinet juridique ? Perte de réputation totale.
Test du seuil : coût du ZDR < coût de l’exposition ? Si oui, investissez. Sinon, explorez une approche hybride.

4. L’architecture hybride : Elosia

Les organisations matures déploient une stratégie multi-fournisseur :

ZDR : données hautement sensibles.
Standard : données non-sensibles, volume élevé, sensibilité au coût.
Modèle privé local : données extrêmement sensibles nécessitant un contrôle total.

Cette segmentation permet une efficacité économique tout en protégeant réellement ce qui doit l’être.

Conclusion : récapitulatif du décideur

Le Zero Data Retention est un outil puissant, mais c’est un outil, pas un impératif universel.

Si vous êtes dans le healthcare, la finance, le legal : le ZDR n’est pas une option, c’est une exigence non-négociable.

Si vous êtes une PME ou une startup sans données fortement réglementées : une approche hybride est plus intelligente. Utilisez le ZDR pour votre pipeline de données sensibles, mais déployez les modèles standard pour le volume non-sensible.

Si vous envisagez de basculer de ChatGPT grand public à une solution ZDR : procédez avec les yeux ouverts. La qualité et la capacité du modèle ne changeront pas, mais les coûts augmenteront. Vérifiez que c’est justifié par votre profil d’exposition de données.

Enfin, rappelez-vous ceci : le ZDR protège vos données des serveurs du fournisseur d’IA. Il ne protège pas vos données du reste de votre infrastructure, des breaches internes, ou des erreurs d’implémentation de votre côté. Le ZDR est une couche de la stratégie de sécurité des données, pas la stratégie entière.