GDPR Pseudonymizer¶
Pseudonymisez vos documents français grâce à l'IA, avec relecture humaine obligatoire
Préparez vos documents sensibles pour l'analyse par IA en toute sérénité : traitement entièrement local, relecture humaine systématique, conformité RGPD.
Qu'est-ce que GDPR Pseudonymizer ?¶
GDPR Pseudonymizer est un outil conçu pour la confidentialité. Il associe la rapidité de l'IA à la rigueur de la relecture humaine pour pseudonymiser des documents en français. Disponible en ligne de commande (CLI) et en application de bureau (v2.0 en développement). Contrairement aux solutions entièrement automatiques ou aux services cloud, il mise sur l'absence totale de faux négatifs et sur la solidité juridique grâce à un processus de validation obligatoire.
Pour qui ?
- Organisations sensibles à la protection des données ayant besoin d'analyses IA conformes au RGPD
- Chercheurs universitaires soumis aux exigences des comités d'éthique
- Équipes juridiques et RH qui ont besoin d'une pseudonymisation opposable
- Utilisateurs de LLM souhaitant exploiter des documents confidentiels en toute sécurité
Fonctionnalités principales¶
Confidentialité au cœur de l'architecture¶
- Traitement 100 % local — vos données ne quittent jamais votre machine
- Aucune dépendance cloud — fonctionne entièrement hors ligne après installation
- Tables de correspondance chiffrées — chiffrement AES-256-SIV, protégé par mot de passe
- Aucune télémétrie — ni collecte analytique, ni communication externe
IA + relecture humaine¶
- Détection hybride — l'IA repère environ 60 % des entités (NLP + expressions régulières + dictionnaire géographique, F1 59,97 %)
- Validation obligatoire — vous vérifiez et confirmez chaque entité (précision finale de 100 %)
- Interface de validation rapide — raccourcis clavier, actions groupées, moins de 2 min par document
- Regroupement des variantes — les formes apparentées (« Marie Dubois », « Pr. Dubois », « Dubois ») sont fusionnées en un seul élément à valider
Traitement par lot¶
- Pseudonymes cohérents — une même entité reçoit le même pseudonyme dans tous les documents
- Résolution par composition — « Marie Dubois » et « Marie » sont résolus de façon cohérente
- Traitement sélectif — option
--entity-typespour ne traiter que certains types (PERSON, LOCATION, ORG) - Plus de 50 % de temps gagné par rapport à la rédaction manuelle
Pseudonymes thématiques¶
Trois thèmes intégrés : Neutre (prénoms français), Star Wars et Le Seigneur des Anneaux.
Prise en main rapide¶
# Installer depuis PyPI
pip install gdpr-pseudonymizer
python -m spacy download fr_core_news_lg
# Traiter un document
gdpr-pseudo process interview.txt
Consultez le guide d'installation pour des instructions détaillées selon votre plateforme et le tutoriel pour des guides pas à pas.
Documentation¶
| Section | Description |
|---|---|
| Installation | Instructions selon votre plateforme (Windows, macOS, Linux, Docker) |
| Tutoriel | Guides pas à pas |
| Référence CLI | Documentation complète des commandes |
| FAQ | Questions fréquentes |
| Dépannage | Erreurs courantes et solutions |
| Méthodologie | Approche technique, conformité RGPD, citation académique |
| Référence API | Documentation des modules pour les développeurs |
Comment ça marche¶
- Détecter — Le NLP hybride + expressions régulières repère les entités candidates dans le texte français
- Valider — Vous passez en revue chaque entité avec son contexte
- Pseudonymiser — Les entités confirmées sont remplacées par des pseudonymes thématiques
- Stocker — Les correspondances sont chiffrées dans une base locale pour assurer la cohérence et la réversibilité
Conformité RGPD¶
GDPR Pseudonymizer contribue à la conformité avec les articles 4(5), 25, 30, 32 et 89 du Règlement général sur la protection des données. Consultez le document Méthodologie pour la correspondance complète avec le RGPD.
Important : Les données pseudonymisées restent des données personnelles au sens du RGPD. Consultez votre délégué à la protection des données pour des conseils de conformité adaptés.
Statut¶
Version publiée : v2.0.0 (mars 2026) — Interface graphique, exécutables autonomes et accessibilité WCAG AA
Environnements pris en charge : Python 3.10-3.12 | Windows, macOS, Linux | Formats .txt, .md, .pdf, .docx, .xlsx, .csv | Français | Interface graphique : pip install gdpr-pseudonymizer[gui]
Consultez la FAQ pour la feuille de route du produit.