Tableau de bord et analyse de données

EDC N°2 – (OPS) Transformer des e-mails bruts en tableau de bord décisionnel. Tri et priorisation.

Contexte

Ma boîte Gmail reçoit un volume important d’e-mails récurrents. Une partie est utile (transactionnel, suivi, achats). Une autre partie s’accumule et crée du bruit, ce qui ralentit le tri et rend les priorités moins visibles.

J’ai donc construit MyMail DNA pour objectiver ce flux entrant et transformer la boîte mail en source de données exploitable, afin de décider quoi filtrer, désinscrire, archiver et prioriser.

L’analyse présentée porte sur un échantillon de 2 527 e-mails, enrichi et catégorisé via un workflow automatisé, puis restitué dans un tableau de bord Looker Studio et un rapport de synthèse.

Mission/ Objectif

Objectif principal : mettre sous contrôle un flux d’e-mails à fort volume en le transformant en données actionnables et en indicateurs, afin de réduire le bruit et sécuriser la visibilité des messages importants.

Objectifs spécifiques

  • Extraire un échantillon d’e-mails et le structurer avec des champs simples et utilisables (expéditeur, catégorie, statut lu ou non lu).

  • Automatiser le traitement de bout en bout (nettoyage, normalisation, enrichissement, stockage).

  • Produire des indicateurs orientés décisions (filtrer, supprimer, conserver, prioriser).

  • Restituer dans un tableau de bord interactif et livrer un rapport clair (constats, limites, actions recommandées).

Approche

J’ai conçu l’outil pour transformer des données en décisions concrètes, plutôt que de produire des statistiques sans usage.

Cadrage du besoin

  • Réduire le bruit et le stock de non lus.

  • Identifier les catégories qui saturent la boîte mail.

  • Repérer les principales sources du non lu pour agir (désinscription, filtres, archivage).

Modèle de données minimal

Sélection de trois champs actionnables dès le départ : expéditeur (from_id), catégorie, statut lu ou non lu (is_read). Objectif : éviter de complexifier avant d’avoir un premier résultat exploitable.

Chaîne de traitement reproductible

Mise en place d’un flux rejouable : extraction, normalisation, enrichissement, stockage tabulaire. Objectif : relancer la même analyse après changements (filtres, désinscriptions) et comparer.

Visualisation et interprétation

Tableau de bord pour rendre visibles les priorités (lus vs non lus, répartition par catégorie, pression du flux). Règle : chaque indicateur doit déboucher sur une action (désinscrire, filtrer, archiver, prioriser).

Points de vigilance intégrés

  • Respect de la vie privée : données anonymisées et stockées localement. L’expéditeur est anonymisé par masquage partiel, ce qui peut regrouper plusieurs expéditeurs sous un même identifiant ; les analyses “top expéditeurs” restent des ordres de grandeur.

  • Sécurité : utilisation d’outils open source et auto-hébergés.

Actions clés

Méthode

Extraction et préparation des données

  • Extraction d’un échantillon de 2 527 e-mails.
  • Nettoyage des données et standardisation des formats.
  • Création d’une catégorisation simple : newsletter, publicité, autre, achat, rappel.

Automatisation du workflow (Pipeline)

  • Téléchargement du fichier source (Drive).
  • Extraction des lignes depuis le CSV.
  • Normalisation et enrichissement (catégorie, statut de lecture).
  • Alimentation automatique d’une feuille Google Sheets pour servir de source stable au reporting.

Restitution et livrables

  • Création du tableau de bord Looker Studio (répartition, lus vs non lus, lecture par catégorie, expéditeurs du stock non lu).
  • Rédaction du rapport de synthèse (constats, limites, hypothèses, actions recommandées).
  • Documentation projet (PRD, journal technique, planification).

Résultats obtenus

  • Échantillon analysé : 2 527 e-mails, dont 63 % non lus.
  • Bruit principal : les newsletters (environ 72 % du volume) et la publicité (environ 17 %) alimentent l’essentiel du stock non lu.
  • Signal clair : les e-mails d’achat sont majoritairement lus (environ 92 %), ce qui indique que les messages à enjeu sont déjà traités.
  • Décisions : désinscriptions et filtres sur les flux récurrents, sécurisation de la visibilité des e-mails transactionnels.
  • Note : l’analyse par expéditeur reste indicative, car l’expéditeur est anonymisé.

Livrables

Compétences démontrées

Cadrage opérationnel Définition d’objectifs mesurables Analyse de données Segmentation Reporting Analyse du stock non lu Pilotage de projet Documentation (PRD, journal technique) Traçabilité des choix Sensibilité données Anonymisation Interprétation prudente des expéditeurs