En 2 semaines, j’ai été confronté à 2 demandes proches : supprimer certaines données de Google Analytics. La base avec les outils d’analyse web c’est d’avoir des données justes. Sinon aucune analyse et surtout aucune bonne décision ne peut être prise. Il faut donc parfois faire le pompier, se retrousser les manches et faire le ménage dans GA.
Je ne vais pas traiter ici du spam referrer (déjà bien connu et gérable via des filtres notamment) ni de la suppression des données utilisateurs (RGPD, mon amour).
Les données de test sur la prod, la boulette
La première demande est consécutive à la migration d’un plan de taggage d’Universal Analytics vers GA4. Il y a eu un couac entre les différentes vues et toutes les données de test se sont retrouvées au milieu des données de la vue de production. Des tests d’événements et d’objectifs polluaient plusieurs jours de statistiques de façon suffisamment importantes pour invalider plusieurs mois de tracking.
La solution a été radicale : supprimer les données. Depuis les options d’administration, Google Analytics propose une fonctionnalité de demande de suppression de données.
C’est un peu l’option nucléaire. On choisit une date de début et une date de fin et tout ce qui se trouve dans l’intervalle est supprimé. En prenant le temps, on peut néanmoins choisir quoi filtrer et supprimer de façon plus sélective.
La manipulation n’est pas immédiate. Les données sélectionnées sont mises en attente (délai de grâce de 7 jours) puis doivent être validées par l’administrateur du compte.
La vente à plusieurs millions d’euros
La seconde demande était liée à un site ecommerce qui avait une fausse commande à plusieurs millions d’euros. La banque n’a pas honoré la commande mais la vente a quand même été poussée jusqu’au compte Google Analytics. Dans ce cas précis, il se trouve que le module qui est en charge de transmettre les informations ecommerce à Google Analytics est peu performant et/ou mal configuré et laisse passer les ventes qui n’ont pas abouti d’une part et empêche les commandes annulées d’être annulées à leur tour dans GA.
Avec cette vente hors norme, l’intégralité des données ecommerce sur GA devenaient illisibles.
En même temps, il ne fallait pas supprimer les autres ventes et comme il s’agit d’un compte Universal Analytics, l’option utilisée pour le premier cas ne marchait pas.
J’ai donc dû injecter dans GA des données inverses à la vente à supprimer afin d’annuler son effet. Cela peut se faire depuis un outil peu connu : le constructeur de hits. Puissant mais sans garde fou, cet outil permet d’envoyer directement dans GA des données.
Dans le cas présent, et pour faire simple, il a fallu envoyer les mêmes données en négatif via le « Measurement Protocol » de GA. Les paramètres sont tous listés ici. Tout se fait simplement depuis une interface web mais attention, l’outil est brut et chaque clic doit être réalisé avec soin. Une fois que le clic est fait, la donnée se retrouve dans GA en quelques minutes.
Si l’injection du hit se fait dans la journée, la transaction sera annulée. Sinon, 2 transactions apparaîtront mais s’annuleront sur les chiffres totaux.