Comment mettre en place la proxyfication Google Analytics 4 ?

Comment mettre en place la proxyfication Google Analytics 4 ?

Le

Pour assurer la conformité de Google Analytics 4 (GA4) avec le RGPD, il est essentiel de suivre un ensemble de pratiques recommandées lors de sa configuration via un proxy. Ces « 8 règles d’or » constituent un guide pour proxyfier GA4 de manière sécurisée et conforme.

1. Respecter les conditions d’hébergement du proxy selon le RGPD

Le serveur proxy doit être hébergé de manière à garantir la non-transfert des données hors de l’Union Européenne, privilégiant ainsi un hébergement au sein de l’UE pour assurer la conformité avec le RGPD.

OVH, O2switch…

2. Supprimer l’information de site référent

Il est crucial de ne pas conserver les informations de referrer, pouvant servir de clé de réidentification. Cela implique techniquement de manipuler et filtrer ces données pour éviter qu’elles ne soient attribuées à une personne identifiable.

Pour ne pas conserver les informations de referrer (site référent) de manière à éviter qu’elles ne servent de clé de réidentification, il est nécessaire d’adopter une approche technique qui filtre et manipule ces données avant qu’elles ne soient envoyées à Google Analytics 4 (GA4) ou à tout autre outil d’analyse. Voici les étapes concrètes à suivre, en supposant l’utilisation de Google Tag Manager (GTM) comme intermédiaire pour la gestion des tags de suivi sur votre site :

Étape 1 : Création des variables dans GTM

  1. Créer une variable « Données d’événement » pour le referrer :
    • Accédez à votre compte Google Tag Manager.
    • Dans le menu de gauche, cliquez sur « Variables », puis sur « Nouvelle » pour créer une nouvelle variable.
    • Sélectionnez le type de variable « Données d’événement ».
    • Dans le champ « Chemin de la variable », saisissez page_referrer. Cela permettra de capturer l’URL complète du referrer.
  2. Créer une variable « URL parser » pour extraire le nom de domaine :
    • Toujours dans la section « Variables », créez une nouvelle variable.
    • Choisissez le type « URL ».
    • Dans « Composant de l’URL », sélectionnez « Nom de l’hôte ».
    • Comme « Source URL », utilisez la variable « Données d’événement » que vous avez créée à l’étape précédente.
  3. Créer une variable « Tableau de conversion » pour gérer les referrers :
    • Créez encore une nouvelle variable.
    • Sélectionnez le type « Tableau de conversion ».
    • Utilisez la variable « URL parser » comme variable d’entrée.
    • Configurez les règles de conversion pour que, si le referrer est interne (nom de domaine de votre site), vous conserviez cette information, et si le referrer est externe (autre nom de domaine), vous la masquiez ou la remplacez par une valeur générique comme « external » ou « not set ».

Étape 2 : Modifier la configuration de la balise GA4

Après avoir configuré les variables nécessaires, vous devez ajuster la configuration de votre balise GA4 pour utiliser ces variables :

Logiciel RGPD
  1. Aller à la balise GA4 dans GTM :
    • Trouvez la balise GA4 concernée (celle qui envoie les événements de page vue, par exemple) et ouvrez-la pour modification.
  2. Intégrer la variable « Tableau de conversion » :
    • Dans les paramètres de la balise, cherchez à ajouter ou modifier des champs.
    • Pour le champ « page_referrer » ou un champ personnalisé que vous souhaitez utiliser pour transmettre l’information de referrer, utilisez la variable « Tableau de conversion » créée précédemment. Cela garantira que seul le referrer filtré soit inclus dans les données envoyées à GA4.

Étape 3 : Tester et valider

  • Utilisez le mode Aperçu de GTM pour tester votre configuration et vous assurer que le referrer est correctement manipulé selon vos règles.
  • Vérifiez dans les rapports en temps réel de GA4 ou dans l’interface de GTM que le referrer est bien traité comme vous l’avez configuré.

3. Remplacer l’identifiant utilisateur

Le « client_id » doit être remplacé par une valeur générée par le serveur de proxyfication, empêchant ainsi le suivi des utilisateurs sur la durée. Cela permet de distinguer les sessions sans suivre les utilisateurs individuellement.

Pour remplacer le « client_id » par une valeur générée par le serveur de proxyfication, vous modifiez le comportement standard de Google Analytics (GA) qui attribue habituellement un identifiant unique à chaque utilisateur pour suivre leurs interactions sur la durée. L’objectif ici est de préserver la confidentialité des utilisateurs en évitant de les suivre de manière identifiable à travers les sessions. Voici une approche concrète pour y parvenir, en utilisant le serveur de proxyfication comme intermédiaire entre les utilisateurs et Google Analytics :

Étape 1 : Configuration du serveur de proxyfication

  1. Capturer les requêtes GA : Le serveur de proxyfication doit être configuré pour intercepter les requêtes destinées à Google Analytics. Cela peut être réalisé en redirigeant les requêtes du domaine de GA (www.google-analytics.com) vers votre serveur proxy.
  2. Modifier le « client_id » : À chaque requête interceptée, le serveur doit lire le « client_id » envoyé par le navigateur de l’utilisateur. Plutôt que de transmettre ce « client_id » à GA, le serveur génère une nouvelle valeur qui sera utilisée comme identifiant pour la session en cours. Cette valeur peut être un hash basé sur une combinaison de l’identifiant de session et d’un sel, qui change régulièrement (par exemple, toutes les 24 heures).
  3. Envoyer la requête modifiée à GA : Après avoir remplacé le « client_id », le serveur de proxyfication envoie la requête modifiée à Google Analytics. La réponse de GA est ensuite transmise au navigateur de l’utilisateur, si nécessaire.

Étape 2 : Implémentation technique

Pour la génération du nouveau « client_id », vous pouvez utiliser une fonction de hachage côté serveur. Par exemple, en PHP, vous pourriez faire quelque chose comme ceci :

// Générer un "client_id" basé sur la session et un sel qui change régulièrement$sessionId = session_id(); // Ou une autre méthode pour obtenir un identifiant de session$salt = date('Y-m-d'); // Utiliser la date comme sel pour changer la valeur quotidiennement $newClientId = hash('sha256', $sessionId . $salt); // Utilisez $newClientId comme le nouveau "client_id" dans la requête envoyée à GA

Cette approche garantit que chaque utilisateur se voit attribuer un identifiant unique pour la durée de sa session, mais cet identifiant ne permet pas de suivre l’utilisateur de manière continue au-delà de cette session. Cela aide à maintenir un équilibre entre la collecte de données analytiques utiles et le respect de la vie privée des utilisateurs conformément au RGPD.

Étape 3 : Tester et valider

  • Vérifiez que le serveur de proxyfication fonctionne correctement en testant les requêtes envoyées à GA et en vous assurant que le « client_id » est bien remplacé par la nouvelle valeur générée.
  • Assurez-vous de la conformité RGPD en vérifiant que les identifiants de session ne permettent pas une réidentification des utilisateurs et que vous avez mis en place les mesures nécessaires pour obtenir le consentement des utilisateurs concernant l’usage des cookies et le suivi analytique.

Cette méthode nécessite une certaine expertise technique pour sa mise en œuvre, en particulier pour la configuration du serveur de proxyfication et la manipulation sécurisée des requêtes. Il est recommandé de travailler avec un développeur ou un expert en sécurité informatique pour garantir que la solution est mise en place efficacement et en toute sécurité.

4. Retraiter les informations pouvant générer une empreinte

Il faut exclure ou modifier certaines données comme la résolution de l’écran ou le navigateur utilisé, pour éviter la création d’une empreinte digitale unique de l’utilisateur.

5. Éviter la collecte d’identifiants entre sites ou déterministes

La collecte d’informations permettant d’identifier les utilisateurs entre différents sites ou via des identifiants déterministes doit être désactivée pour respecter la vie privée des utilisateurs.

6. Ne pas transférer l’adresse IP vers l’outil de mesure

Il est recommandé de ne pas envoyer l’adresse IP à GA4. L’anonymisation de l’IP par GA4 ne suffit pas selon la CNIL, il faut donc appliquer des méthodes pour masquer ou crypter cette information.

7. Supprimer tout paramètre contenu dans les URL collectés

Pour protéger la vie privée, les paramètres URL tels que les UTM ou gclid doivent être filtrés ou supprimés avant leur envoi à GA4. Cela affecte la capacité de GA4 à déterminer les sources d’acquisition, mais est nécessaire pour la conformité RGPD.

8. Supprimer toute autre donnée pouvant mener à une réidentification

Une révision approfondie des données collectées par GA4 doit être effectuée pour s’assurer qu’aucune information ne peut mener à la réidentification des utilisateurs. Ceci inclut les données de localisation précises, les identifiants uniques, les adresses email, etc.

Ces mesures, bien que complexes, sont indispensables pour aligner l’utilisation de Google Analytics 4 avec le RGPD. L’assistance d’un expert en protection des données personnelles peut s’avérer cruciale pour naviguer avec succès dans ces exigences et garantir une mise en œuvre conforme et sécurisée.

DPO Partagé
DPO Partagé
DPO EXTERNALISE - Disponible du Lundi au Samedi - Contactez nous au 01 83 64 42 98 ou par mail à contact@dpo-partage.fr DPO PARTAGE est le leader des DPO en données de santé et données sensibles. Urgence Violation Données +33 7 56 94 70 90

Intéressant ? Partagez-le !

Newsletter

Audit gratuit Conformité RGPD

spot_imgspot_img

A ne pas manquer !

Encore plus d'actualités
Informations RGPD

Prenez garde à ce piratage Gmail qui peut même contourner la double authentification

Aucun système informatique n'est inviolable, même ceux réputés parmi...

Les outils logiciels au cœur de la conformité RGPD : un atout indispensable pour les DPO

Logiciels conformité RGPD : La mise en conformité avec...

Sanction record pour hubside.store en matière de prospection commerciale

Le 4 avril 2024, la Commission Nationale de l'Informatique...