Table ronde "Stratégie Data : feuille de route, organisation, cas d’usage" de la 15ème édition du meetup Paris Data Ladies

Temps de lecture : 16 minutes

Introduction

Le meetup « Paris Data Ladies » a été créé en 2016 et compte environ 2300 membres, femmes et hommes passionnés par la Data. Le meetup, à l’origine initié par des collaboratrices de chez Quantmetry, propose des talks de qualité autour des sujets de la Data en privilégiant les speakeuses afin de mettre les femmes de la Data à l’honneur.

Pour la 15ème édition du meetup, une table ronde a été organisée sur le thème de la « Stratégie Data : feuille de route, organisation, cas d’usage ». Cette édition a été hébergée par Swiss Life France. Nous tenons à les remercier chaleureusement, et particulièrement Cynthia Traoré, Head of Data Lab & Chief Data Scientist, pour son accueil ainsi que l’organisation logistique de cet évènement. Cette édition du Paris Data Ladies, comme les précédentes, fut une réussite et cela n’aurait pu être le cas sans l’implication de partenaires d’excellence tels que Swiss Life.

Autour du sujet de la Stratégie Data, nous avons eu le plaisir d’accueillir 4 femmes, responsables des entités Data et impliquées au quotidien avec leurs équipes dans la transformation Data de leurs entreprises.

Dans le secteur des médias, Dounia Zouine, avec une formation en e-Business et Stratégie, exerce la fonction de Group Chief Data Officer au sein d’Unify depuis un an. Unify filiale de TF1 présente dans 10 pays, rassemble les nouvelles activités digitales du groupe TF1, autour de 3 activités et une vingtaine de marques :

- Media digitaux : aufeminin, Marmiton, My Little Paris, Merci Alfred, Doctissimo, Les Numériques, CNET, ZDNET, etc.
- Agences de services digitaux : Vertical Station, Gamned!, Magnetism, etc.
- E-commerce : MyLittleParis, Beautiful Box by aufeminin, Gretel, Madeline, Joyce

Dans le secteur de la gestion de l’eau et des déchets, Chafika Chettaoui est diplômée en Computer Science (PhD en bioinformatics). Son parcours centré sur du Business Analytics et de la Data Science, l’a menée en cabinet de conseil et chez un acteur majeur de secteur du luxe avant de rejoindre le groupe Suez. Elle y exerce le poste de Chief Data Officer depuis un an et y apporte une double casquette Gouvernance de la donnée et Data Science.

Côté Banque et Assurance, Clémence Panet Amaro est diplômée en Économétrie et Économie et a rejoint le Groupe La Poste en 2004 ; groupe au sein duquel elle a réalisé un parcours professionnel centré sur la Data et la modélisation. Clémence a participé à la création du département data de La Banque Postale et occupe le poste, depuis mai 2018, de Head of Data Analytics & Chief Data Scientist.

Cynthia Traoré co-organisatrice de cette 15ème édition du Paris Data Ladies, est diplômée en Statistiques et Économétrie, avec un parcours dans le secteur de l’Assurance orienté Data mining puis Data Science. Cynthia est responsable du département Data Science qui orchestre et met en œuvre l’ensemble des initiatives Big Data, Data Science et Intelligence Artificielle de Swiss Life France. Dans ce cadre, elle a créé le Data Lab transverse nommé « Data Champions » afin de promouvoir une approche data driven au sein de l’entreprise et de développer des use cases au service des enjeux et des besoins des différents métiers.

La table ronde a été animée par Tsvetina Bacheva, Senior Data Consultant chez Quantmetry.

De gauche à droite: Tsvetina Bacheva, Chafika Chettaoui, Clémence Panet Amaro, Dounia Zouine, Cynthia Traoré.

Sommaire

La thématique de la Stratégie Data est toujours, à l’heure actuelle, source de débats aussi bien dans les domaines publics et privés. La réflexion autour de la Stratégie Data des organisations semble varier également fortement selon le secteur d’activité, qu’il soit intrinsèquement basé par nature sur la collecte, l’historicisation et l’exploitation de la donnée (l’exemple du secteur de la Banque et Assurance où la gestion du risque est historiquement liée à la donnée clients) ou non. De ces observations découlent différentes applications de Stratégie Data au sein des organisations que nous avons souhaité aborder au cœur de cette table ronde :

- Organisation, rôles et responsabilités des équipes
- Idéation de cas d’usage
- Critères de choix et de priorisation des cas d’usage
- Financement des projets Data
- Enjeux des entités Data
- Futur envisagé pour les entités Data

Organisation, rôles et responsabilités des équipes

On constate chez nos quatre panélistes une même vision des rôles organisationnels en lien avec les sujets Data.

Au sein même de l’équipe du Data Lab ou Data Factory (soit l’entité Data) existants dans les organisations, sont mis à contribution des profils de Data Scientists souvent généralistes qui sont à même d’utiliser différentes techniques et se former au gré des projets. En effet, la variété des projets Data englobent des techniques variées telles que l’analyse de texte (NLP, voir l’article Cutting-edge NLP 1 : ULMFiT), l’analyse d’image (computer vision, lire notre article sur les DeepFakes et autres générations en lien avec l’image) ou encore l’analyse de séries temporelles (time series, un exemple d’outil avec deepAR) pour n’en citer que les plus avancées à ce jour. A ces profils en Data Science peuvent s’ajouter des profils de Business Analysts, profils également convoités car participant notamment à la prise de décision stratégique de l’entreprise. Au sein des équipes Data, le mot d’ordre est l’agilité, avec le développement d’équipes pluridisciplinaires et la volonté de faire interagir des profils provenant d’univers différents (marketing, finance, services, média, santé, recherche, etc.). Au-delà de l’existence et des missions de l’entité Data, la faisabilité des projets se base sur la synergie de trois entités distinctes qui travaillent ensemble tout au long de la durée de vie d’un projet Data (de la phase de cadrage des initiatives, aux phases d’expérimentation, de passage en pilote et d’industrialisation – voir notre article Datalab, Datafab… Comment repousser ses limites ?). On parle alors du triptyque DSI, Data Lab et équipes métiers. L’équipe IT, ou Direction des Systèmes d’Information, est généralement composée de Data Architects, de Data Enginers et de DevOps, soit de profils informatiques techniques à l’ère du Big Data. Les équipes métiers sont les entités de l’organisation qui regroupent les équipes opérationnelles comme les Directions Marketing, RH, Production, Qualité, R&D, etc. Et c’est bien la synergie de ces trois entités qui garantit le cadrage précis des besoins, le déploiement des projets Data et une bonne conduite du changement embrassée par tous. Swiss Life, par exemple, a décidé de créer deux entités : un département Data Science avec des Data Scientists et des Data Analysts ; et un Data Lab transverse pluridisciplinaire qui intègre la DSI, les Product Owners, les Ingénieurs BI et des représentants Data de chaque direction, afin d’embarquer toute l’entreprise dans cette dynamique Data.

En parallèle de l’organisation même des équipes, on distingue deux types d’usages des données qui orientent les organisations : un usage interne et un usage externe de la donnée. L’usage interne de la donnée concerne par exemple le secteur de la Banque et de l’Assurance qui collecte la donnée pour l’exploiter à des fins qui lui sont propres, c’est à dire dans le cadre de la gestion client et de la gestion des risques, par exemple. De son côté, une entreprise comme Groupe Unify dans le domaine des activités médias numériques présente à la fois un usage interne de la donnée (mesure de l’audience, évaluation de la qualité des contenus publiés, etc.) mais aussi un usage externe de la donnée avec un business model à part entière basé sur la monétisation des données de trafic. Ces deux usages distincts sont donc à prendre en compte dans le déploiement des projets Data, notamment en termes de contraintes réglementaires (consentement client, optin marketing, etc.) nécessaires au respect du RGPD (Règlement Général de Protection des Données) applicable depuis Mai 2018 (voir notre article Les 5 concepts-clés du RGPD version 2018).

Idéation de cas d’usage

Il existe des cas d’usage « imposés » qui sont indispensables vis-à-vis des réglementations dans certains secteurs, comme par exemple, la détection de fraude par les banques. D’autres cas d’usage sont considérés plutôt comme des « classiques » car ils existent depuis plusieurs années, comme dans le domaine du marketing par exemple avec les scores d’appétence client, la détection de moment de vie, etc. Afin de compléter leur portfolio et de répondre aux besoins de tous les métiers en valorisant leurs données, les entités Data travaillent également sur des cas d’usage « innovants » dans leurs secteurs qui aideraient à la construction de l’image de l’entreprise – amélioration de service client, activités RH, etc.

Dans un premier temps, les initiatives Data semblent naître des Data Labs qui possèdent une prise de recul plus aisée par rapport aux enjeux opérationnels à court terme que rencontrent les métiers. Comme le dit Clémence Panet Amaro (La Banque Postale), le Data Lab peut être considéré comme un “cabinet de conseil interne et gratuit” qui permet d’identifier et de développer des projets Data à forte valeur ajoutée potentielle. Si ce n’est fait en parallèle, c’est souvent dans un second temps que les équipes métiers, une fois les premières “success stories” et ROI mis en lumière, auront une vision plus claire des retours sur investissements potentiels pour pouvoir proposer eux-mêmes des initiatives. Dans ce sens, chez Swiss Life, les métiers sont par exemple invités une fois par an à pitcher pour présenter leurs projets Data et les résultats atteints ou espérés et ainsi encourager les initiatives Data au sein des autres entités.

Le Groupe Unify travaille principalement sur trois types de cas d’usage liés au cœur de métier digital – audience, contenu et publicité. Concernant l’audience, il s’agit de la définition des types de persona et de leurs préférences en termes de fond et forme du contenu ; mesure de la performance des contenus (engagement de l’audience), choix des canaux de distribution pour optimiser leur performance ; analyse sémantique du contenu (key words, etc.) ; optimisation de la place d’enchère des publicités.

Critères de choix et de priorisation des cas d’usage

Nos panélistes s’accordent sur l’importance de trois critères à prendre en compte : la qualité de la donnée (disponibilité, accessibilité), le potentiel ROI (retour sur investissements) dégagé ainsi que l’implication des équipes qui reste la condition ultime, et pourtant la moins tangible, de la réussite d’un projet Data. En phase d’expérimentation, le calcul du ROI reste pourtant complexe à anticiper selon les cas d’usage. La définition d’un ROI pour un cas d’usage sur la détection de fraude, par exemple, peut être estimée en fonction de la fraude et des amendes qui pourront être évitées. A contrario, un cas d’usage sur la qualité de service, elle-même basée sur la satisfaction ou la fidélité client est plus complexe à définir, car les résultats sont par nature visibles à moyen ou long-terme donc difficilement anticipables en termes de calcul de ROI. Même si le ROI est considéré comme un critère très important dans le choix et la priorisation des cas d’usage, il pourrait également freiner l’innovation si l’absence d’un ROI quantifié est un critère éliminatoire pour le lancement d’une expérimentation.

Afin d’ajouter un critère supplémentaire à la hiérarchisation des cas d’usage, Dounia Zouine (Groupe Unify) nous rappelle que l’interprétabilité des modèles (voir notre Livre Blanc 2018, “IA, explique-toi !”) est également un critère à considérer car il facilite, aux phases suivantes, la prise en main des projets Data par les équipes et la bonne compréhension des modèles en supprimant l’effet “black box” guettant tout projet d’intelligence artificielle. Et en effet, cela n’est pas optionnel car l’interprétation des modèles reste une condition essentielle pour évaluer et valider les outputs des projets Data. Par ailleurs, la manière de structurer l’équipe du Data Lab peut favoriser l’accélération des projets. Au sein de l’entité Data du Groupe Suez, une même équipe travaille par exemple sur deux canaux d’accélération de projets distincts. Le premier “stream de tests” est constitué de sessions de six mois pendant lesquelles des initiatives Data sont lancées. Il s’agit dans ces cas-ci de sujets majoritairement bottom-up, c’est à dire initiés par les équipes métiers. On pourrait rapprocher cet environnement de celui d’un incubateur. Si les projets ne sont pas concluants, ils sont arrêtés ou mis en pause s’ils sont des opportunités pour un temps futur. En parallèle, un second “stream de transformation” de projets Data majoritairement top-down (projets sponsorisés par le top management et à destination des équipes métiers) permet d’accélérer les sujets classés prioritaires pour les passer le plus rapidement possible en production. Cette distinction permet une allocation des ressources (techniques et humaines) adaptée selon chaque niveau de priorité et maturité des projets. Enfin l’acculturation des équipes est essentielle même si elle reste un facteur difficilement contrôlable. Comme l’a dit Henri Ford (1863-1947) “les deux choses les plus importantes n’apparaissent pas au bilan de l’entreprise: sa réputation et ses hommes.” Le capital humain est la plus grande source de valeur ajoutée car il permet de transformer les initiatives Data en réussite. C’est pourtant ce critère-ci qui reste le moins tangible aujourd’hui. L’objectif est donc le suivant : embarquer les équipes métiers pour, qu’une fois convaincues, elles se réapproprient le lead des initiatives Data pour les implémenter efficacement, et profiter d’un retour sur investissement (technique, humain, rapide) maximal.

Financement des projets Data

Chez le Groupe Suez, le financement des projets Data est partagé entre l’entité Data et les business units afin d’assurer la priorisation des projets et l’implication des métiers. Chez La Banque Postale, le Groupe Unify et Swiss Life, le financement des projets Data fonctionne de la même façon. Les phases d’expérimentation sont financées par le Data Lab mais les phases d’industrialisation et de mise en production – par les métiers. Comme le dit Cynthia Traoré (Swiss Life) – « Ce qui est gratuit n’a pas de valeur ». Le co-financement des use cases par les métiers est un signe d’engagement. En revanche, il est à noter que l’engagement des métiers dépend énormément de la maturité Data de l’entreprise. Le métier a besoin de comprendre l’apport et la valeur ajoutée de la data science pour imaginer des use cases qui répondraient à son besoin et pour s’engager sur le financement d’une potentielle mise en production de la solution Data.

Enjeux des entités Data

La Gouvernance Data est citée par toutes comme un prérequis qui nécessite néanmoins une vigilance accrue sur les enjeux de collecte (données manquantes, consentement RGPD etc.) et de qualité des données. A ce sujet, Clémence Panet Amaro (La Banque Postale) rappelle le caractère éminemment stratégique de la “Golden Data”. Résoudre ces problématiques en consolidant les standards qualité et réglementaire est certes chronophage mais nécessaire pour garantir la bonne transformation des expérimentations en pilote puis en industrialisation, pour un ROI maximisé.

Du côté des challenges techniques, nos expertes s’accordent sur l’importance d’accélérer la coordination des équipes IT et Data Science. En effet, celles-ci sont encore silotées dans deux entités distinctes avec, pour l’équipe IT, une prise de relais tardive (au stade du passage en industrialisation) du travail des Data Scientists fait en amont et des difficultés évidentes d’appropriation. La collaboration IT et data scientists dès la phase d’expérimentation s’est progressivement mise en place chez Swiss Life ainsi qu’à La Banque Postale, comme nous le partage Cynthia Traoré et Clémence Panet Amaro. Concernant l’architecture, la mise en place d’un Data Lake unique reste particulièrement complexe. En effet, les SI étant extrêmement variés (notamment pour les entreprises dont les SI existent depuis plusieurs décennies), la démarche de migration sur un Data Lake unique est coûteuse et nécessite une vigilance toute particulière à porter sur la sécurisation de la donnée. A ce jour, il semblerait que ces problématiques continuent de ralentir le passage en industrialisation des projets Data. La mise en place d’un Data Lake commun efficient et sécurisé dans un court à moyen terme apparaît comme inestimable pour éliminer ce frein.

D’un point de vue organisationnel, le triptyque entité Data, équipe IT et métiers est bien identifié comme essentiel et porteur de la valeur ajoutée de chaque projet Data. Il faut donc continuer à favoriser l’acculturation des équipes métiers en les incluant le plus tôt possible dans l’identification et la priorisation des cas d’usages, selon leurs propres besoins. Partager progressivement la responsabilité de la réussite des projets Data semble également source de valeur et d’implication des équipes, dans un processus d’acculturation. “Le facteur humain est ici, et comme souvent, la variable la plus complexe à prendre en compte alors que c’est celle qui conditionne la réussite des projets Data”, rappelle Chafika Chettaoui (Groupe Suez). Mais attention à bien distinguer “l’acculturation envisageable et réalisable par l’ensemble du Groupe des espoirs démesurés qui relèvent du monde du rêve”.

Futur envisagé pour les entités Data

Dans un paradigme économique actuel où les métiers évoluent constamment et de manière parfois radicale, la question se pose de savoir qu’adviendra-t-il des entités Data à moyen et long terme. En construction depuis le développement du Big Data et en plein déploiement aujourd’hui, seront-elles amenées à perdurer, ou doit-on envisager la disparition de ces entités au profit de l’appropriation des sujets Data par les équipes métiers elles-mêmes ?

Point de vue partagé par nos panélistes : à court et moyen terme, les entités Data seront toujours au service de l’entreprise, avec comme enjeu “de mettre en évidence et mesurer plus concrètement le ROI des use cases” en capitalisant sur les projets Data plus nombreux à être passés en production, comme le souligne Cynthia Traoré (Swiss Life). A cela s’ajoutera, selon Clémence Panet Amaro (La Banque Postale), la mise en place progressive d’experts Data (Data Steward, responsable notamment de la qualité de la donnée) au sein même des entités métiers pour faire le pont entre entités Data et métiers, développant ainsi un “modèle hybride de Stratégie Data”. Cette coordination, plus fluide, et la capitalisation sur les retours d’expériences garantiront l’accélération des projets Data avec des temps nettement réduits pour le passage des projets au stade d’industrialisation. Pour Dounia Zouine (Groupe Unify), l’idée serait à moyen terme que les entités des Métiers s’enrichissent d’experts dont les compétences évolueront constamment jusqu’à atteindre une autonomie très poussée sur leurs sujets. Le “Chef Chief Data Officer (CDO) conservera son rôle de chef d’orchestre Data mais se dégagera progressivement de la partie technique” jusqu’à la déléguer quasi-exclusivement aux “experts” qui l’entourent, avec une montée en compétence nécessaire également des compétences IT. Du côté du Groupe Suez, une feuille de route Data sur les trois à cinq prochaines années a été dessinée, avec plusieurs programmes de transformation et la mise en place du rôle de Data Steward au sein des équipes métiers, comme mentionné précédemment. Selon Chafika Chettaoui (Groupe Suez), nous allons également assister au glissement de l’enjeux de la Gouvernance Data vers l’enjeux plus complexe de la “Gouvernance des Algorithmes” (à ce sujet, voir notre Livre Blanc sur le Cycle de Vie des Modèles paru en Octobre 2019). Enfin, il est intéressant d’envisager la possibilité à horizon cinq ans de “voir disparaître les entités Data au profit d’une appropriation totale des sujets Data par les métiers” et même la disparition du poste CDO, comme le propose Chafika Chettaoui (Groupe Suez). C’est l’image du sachet de thé qu’elle reprend du Groupe Accor : celui-ci permet de diffuser la connaissance jusqu’à ce que la transmission ait été parfaitement réalisée ; le sachet de thé perd alors de son intérêt.

Conclusion

Nous souhaitons à nouveau remercier infiniment les intervenantes en tant que responsables des entités Data au sein de leurs entreprises, ayant accepté notre invitation pour participer à cette table ronde du meetup Paris Data Ladies autour du sujet de la Stratégie Data. Pour citer Albert Einstein (1879-1955), « Si j’avais une heure pour sauver le monde, je passerais 59 minutes à définir le problème et 1 minute à trouver la solution ». Et c’est ce qu’a permis, à notre sens, cette table ronde : une heure pour échanger de manière constructive et reconsidérer à plusieurs les problématiques métiers, enjeux, solutions et le futur de la Stratégie Data, demain et après. Merci à toutes les 4 pour votre disponibilité, implication et pour cet échange riche autour d’un sujet aussi complexe, multi-factoriel et passionnant qu’est la Stratégie Data. En effet, cette discussion à susciter de nombreuses réactions et questions en seconde partie de table ronde (Q&A), ce qui montre, nous en sommes certaines, l’intérêt partagé et les questionnements nombreux autour du sujet.

Prochaine édition

Au vu de l’intérêt que vous, participantes et participants, avez porté à cette table ronde et de la richesse des échanges auxquels nous avons pu assister, nous sommes d’ores et déjà enchantées à l’idée d’organiser une prochaine table ronde Paris Data Ladies sur des sujets stratégiques liés à la Data. N’hésitez pas à nous contacter pour partager vos remarques, pistes d’améliorations ou toute idée de sujet que vous souhaiteriez voir abordés lors d’une prochaine édition. Merci également pour votre présence de meetup en meetup qui ne fait qu’enrichir la qualité des échanges et la réflexion sur les sujets Data. Et merci pour le bouche-à-oreille qui nous permet de faire salle comble une nouvelle fois !

ParisDataLadies-ment vôtre,

✍ Article écrit par Tsvetina Bacheva et Aurore Baehr

De gauche à droite: Cynthia Traoré, Chafika Chettaoui, Dounia Zouine, Clémence Panet Amaro, Tsvetina Bacheva.