Qui ignore la nature de sa data ne pourra faire avancer ses troupes

Qui ignore la nature de sa data ne pourra faire avancer ses troupes

Tout comme les grands chefs militaires étudiaient de manière minutieuse leurs cartes avant de se lancer dans une conquête, tout projet de data science doit reposer sur une connaissance approfondie du terrain. Un outil emblématique de la connaissance du patrimoine de données est la cartographie data.
Dans un précédent article, nous prenions le parti de présenter la Gouvernance de la donnée non comme un défi technologique mais comme une aventure humaine (La gouvernance de la data, cette aventure humaine). Nous y évoquions notre première conviction : l’importance d’être conscient de sa data. C’est sur cette conviction que nous voulons aujourd’hui revenir en présentant plus précisément un outil phare de cette connaissance du patrimoine data : la cartographie de la donnée.
La cartographie de la donnée est une représentation globale et macroscopique des données d’une entreprise, elle doit faire fi des frontières préexistantes et représenter d’une part le patrimoine des données présentes dans l’entreprise (c’est le fond de la cartographie) mais aussi ses enjeux stratégiques (c’est sa forme).
Concrètement, une cartographie de la donnée, selon le secteur et les priorités de l’entreprise peut avoir un formalisme très différent avec des typologies de données similaires : « orientée client » si les enjeux business identifiés sont de cet ordre (priorité à des cas d’usage marketing, détection du churn…), orientée processus si au contraire la valeur ajoutée de l’entreprise réside dans l’efficacité de ses processus…
En résumé, il n’y a pas de bon format absolu pour cet outil, simplement un format qui est le reflet de ce que l’entreprise est ou veut devenir.

Une cartographie data : pourquoi et surtout comment ?

Pourquoi une cartographie ? Comme nous l’avons esquissé, la transformation par la donnée est un chantier qu’il est difficile d’amorcer sans méthode et sans outil. La cartographie est à la fois une méthode et un outil d’aide à la décision. Je ne peux pas lancer ma transformation data si je ne suis pas en mesure de décliner ma stratégie en projets et je ne peux pas décider de quels projets data lancer si je ne sais pas de quelle data je dispose.

La méthode

La cartographie data se construit en échangeant avec les opérationnels qui connaissent la donnée. La première étape consiste donc à rencontrer les personnes qui connaissent le mieux les données collectées / stockées par l’entreprise, puis de à regrouper ces données par catégorie. Par exemple, un responsable du CRM vous expliquera qu’il stocke le nom, le prénom, la date de naissance des clients : le détail sera indispensable lorsqu’il faudra cadrer les projets mais ça n’est pas l’exhaustivité qui nous intéresse dans ce travail, vous pourrez donc rassembler ces données en une catégorie « Carte d’identité client ». De la même manière avec une perspective industrielle, si l’on récolte la température, le nombre de tours par minute et le temps de fonctionnement d’un moteur, la catégorie pourrait être résumée par « données de fonctionnement moteur ».
Après avoir rassemblé l’ensemble des catégories de données existantes, il convient de les rassembler sur un format le plus simple possible (idéalement une page) et surtout visuel. Pour cela, un nouveau travail de regroupement s’impose pour esquisser des sur-catégories. Par exemple, les catégories « carte d’identité client » et « Consommation client » peuvent être rassemblés dans une même sur-catégorie « Profil client ». C’est dans cette nouvelle catégorisation que les enjeux métiers doivent rentrer en compte. Faut-il structurer des sur-catégories par canal de contact client dans la cartographie ? Cela peut être pertinent dans le cadre d’un retailer qui orienterait sa stratégie sur le multicanal mais aussi inutile pour prestataire de services B2B qui n’a qu’un site institutionnel.

Typologie, catégorie, mais à quelle granularité descendre ?

Il serait illusoire de vouloir descendre à une maille élémentaire de la donnée (c’est-à-dire 1 typologie = 1 donnée) à moins de ne pas collecter de données du tout. La démarche serait alors à la fois très lourde et perdrait de son intérêt car la cartographie ne serait plus communicable, et personne ne réussirait à appréhender « en un coup d’œil » l’ensemble du patrimoine de l’entreprise. L’audit exhaustif des données est un travail potentiellement utile mais qui n’a pas la même vocation.
Il n’y a pas de règle absolue si ce n’est que la restitution de la cartographie doit être accessible à tous et différente d’un data dictionnaire exhaustif.
Une fois la première version terminée, il faut évidemment itérer, tester cette cartographie auprès des partenaires afin d’évaluer les réactions qu’elle suscite, bref, l’utiliser comme un outil de la transformation et la faire évoluer.

L’outil

La cartographie, pendant sa construction est un merveilleux outil d’acculturation, il permet de sensibiliser aux problématiques data tout en étant un support d’échange et questionnement autour de la stratégie d’entreprise, l’occasion de rappeler les priorités et chantiers stratégiques. Une fois formalisée, elle devient un outil puissant à plusieurs titres :
  • Elle permet de communiquer de manière simple et accessible à tous sur la donnée disponible dans l’entreprise, c’est donc d’abord un outil de communication et visualisation.
    • On peut facilement sous-estimer l’ensemble des données présentes dans l’entreprise, oublier les données non structurées (ah bon, les échanges par mail sont des données ?) ou des données qui ne paraissent pas « métier » a priori mais qui sont bien exploitables.
  • C’est également un outil d’idéation : il est possible d’organiser des ateliers de « brainstorming » de cas d’usage autour de la cartographie. Visualiser toutes les typologies permet de faire des liens atypiques et donc d’arriver à des idées inédites.
  • Enfin, le fonctionnement en « typologie de données » permet de poser de bonnes questions par exemple « Je vois que nous avons une typologie ‘données de la flotte de véhicule’, a-t-on dedans la donnée GPS de chacun des véhicules ? » si la réponse est oui, tant mieux, sinon c’est peut-être une piste de donnée à collecter.
La cartographie permet donc d’embarquer l’ensemble des équipes dans la réflexion autour de la donnée : à collecter, disponible ou exploitable par des cas d’usage, le tout en étant alignée avec la stratégie d’entreprise – c’est la première étape vers une culture « data centric ».

Pour aller plus loin…

Il est toujours possible de donner de la profondeur à une cartographie, par exemple en ajoutant un code couleur représentant la complétude ou la qualité de la typologie de donnée conservée. Cela ajoute de l’information au document mais attention à ne pas sacrifier la lisibilité !
Autre possibilité : afficher des flux de données pour arriver à une approche dynamique et donner un indicateur de « chaleur » de la donnée.

Qui est responsable de la cartographie ?

Et après, une fois la transformation lancée : qui est responsable de la cartographie ? C’est justement la cartographie data qui va permettre de structurer la gouvernance de la donnée et donc de désigner des data owners pour chacune des typologies de données.

Conclusion

La cartographie est une pièce maîtresse de la transformation data, la pierre d’angle entre stratégie, patrimoine, cas d’usage et organisation. Elle aide à structurer la démarche, embarquer les équipes et valoriser cet asset stratégique qu’est la donnée d’entreprise. Cependant elle n’est pas une fin en soi mais un outil qui doit servir un enjeu plus grand : trouver des cas d’usage de la donnée, construire une gouvernance…
Les points clés :
  • La cartographie data est une méthode d’acculturation et de réflexion
  • C’est un outil de communication et idéation qui est différente du data dictionnaire
  • Elle doit refléter les enjeux clés de l’entreprise
  • Elle amène naturellement à une organisation autour de la donnée