IA Strategy
16/12/2019

Table ronde "Stratégie Data : feuille de route, organisation, cas d’usage" de la 15ème édition du meetup Paris Data Ladies


Temps de lecture : 16 minutes
Quantmetry.com : Table ronde
Introduction

Le meetup « Paris Data Ladies » a été créé en 2016 et compte environ 2300 membres, femmes et hommes passionnés par la Data. Le meetup, à l’origine initié par des collaboratrices de chez Quantmetry, propose des talks de qualité autour des sujets de la Data en privilégiant les speakeuses afin de mettre les femmes de la Data à l’honneur.

Pour la 15ème édition du meetup, une table ronde a été organisée sur le thème de la « Stratégie Data : feuille de route, organisation, cas d’usage ». Cette édition a été hébergée par Swiss Life France. Nous tenons à les remercier chaleureusement, et particulièrement Cynthia Traoré, Head of Data Lab & Chief Data Scientist, pour son accueil ainsi que l’organisation logistique de cet évènement. Cette édition du Paris Data Ladies, comme les précédentes, fut une réussite et cela n’aurait pu être le cas sans l’implication de partenaires d’excellence tels que Swiss Life.

Autour du sujet de la Stratégie Data, nous avons eu le plaisir d’accueillir 4 femmes, responsables des entités Data et impliquées au quotidien avec leurs équipes dans la transformation Data de leurs entreprises.

Dans le secteur des médias, Dounia Zouine, avec une formation en e-Business et Stratégie, exerce la fonction de Group Chief Data Officer au sein d’Unify depuis un an. Unify filiale de TF1 présente dans 10 pays, rassemble les nouvelles activités digitales du groupe TF1, autour de 3 activités et une vingtaine de marques :

    • Media digitaux : aufeminin, Marmiton, My Little Paris, Merci Alfred, Doctissimo, Les Numériques, CNET, ZDNET, etc.
    • Agences de services digitaux : Vertical Station, Gamned!, Magnetism, etc.
    • E-commerce : MyLittleParis, Beautiful Box by aufeminin, Gretel, Madeline, Joyce

Dans le secteur de la gestion de l’eau et des déchets, Chafika Chettaoui est diplômée en Computer Science (PhD en bioinformatics). Son parcours centré sur du Business Analytics et de la Data Science, l’a menée en cabinet de conseil et chez un acteur majeur de secteur du luxe avant de rejoindre le groupe Suez. Elle y exerce le poste de Chief Data Officer depuis un an et y apporte une double casquette Gouvernance de la donnée et Data Science.

Côté Banque et Assurance, Clémence Panet Amaro est diplômée en Économétrie et Économie et a rejoint le Groupe La Poste en 2004 ; groupe au sein duquel elle a réalisé un parcours professionnel centré sur la Data et la modélisation. Clémence a participé à la création du département data de La Banque Postale et occupe le poste, depuis mai 2018, de Head of Data Analytics & Chief Data Scientist.

Cynthia Traoré co-organisatrice de cette 15ème édition du Paris Data Ladies, est diplômée en Statistiques et Économétrie, avec un parcours dans le secteur de l’Assurance orienté Data mining puis Data Science. Cynthia est responsable du département Data Science qui orchestre et met en œuvre l’ensemble des initiatives Big Data, Data Science et Intelligence Artificielle de Swiss Life France. Dans ce cadre, elle a créé le Data Lab transverse nommé « Data Champions » afin de promouvoir une approche data driven au sein de l’entreprise et de développer des use cases au service des enjeux et des besoins des différents métiers.

La table ronde a été animée par Tsvetina Bacheva, Senior Data Consultant chez Quantmetry.

 

De gauche à droite: Tsvetina Bacheva, Chafika Chettaoui, Clémence Panet Amaro, Dounia Zouine, Cynthia Traoré.

Sommaire

La thématique de la Stratégie Data est toujours, à l’heure actuelle, source de débats aussi bien dans les domaines publics et privés. La réflexion autour de la Stratégie Data des organisations semble varier également fortement selon le secteur d’activité, qu’il soit intrinsèquement basé par nature sur la collecte, l’historicisation et l’exploitation de la donnée (l’exemple du secteur de la Banque et Assurance où la gestion du risque est historiquement liée à la donnée clients) ou non. De ces observations découlent différentes applications de Stratégie Data au sein des organisations que nous avons souhaité aborder au cœur de cette table ronde :

    • Organisation, rôles et responsabilités des équipes
    • Idéation de cas d’usage
    • Critères de choix et de priorisation des cas d’usage
    • Financement des projets Data
    • Enjeux des entités Data
    • Futur envisagé pour les entités Data

 

Organisation, rôles et responsabilités des équipes

On constate chez nos quatre panélistes une même vision des rôles organisationnels en lien avec les sujets Data.

Au sein même de l’équipe du Data Lab ou Data Factory (soit l’entité Data) existants dans les organisations, sont mis à contribution des profils de Data Scientists souvent généralistes qui sont à même d’utiliser différentes techniques et se former au gré des projets. En effet, la variété des projets Data englobent des techniques variées telles que l’analyse de texte (NLP, voir l’article Cutting-edge NLP 1 : ULMFiT), l’analyse d’image (computer vision, lire notre article sur les DeepFakes et autres générations en lien avec l’image) ou encore l’analyse de séries temporelles (time series, un exemple d’outil avec deepAR) pour n’en citer que les plus avancées à ce jour. A ces profils en Data Science peuvent s’ajouter des profils de Business Analysts, profils également convoités car participant notamment à la prise de décision stratégique de l’entreprise. Au sein des équipes Data, le mot d’ordre est l’agilité, avec le développement d’équipes pluridisciplinaires et la volonté de faire interagir des profils provenant d’univers différents (marketing, finance, services, média, santé, recherche, etc.). Au-delà de l’existence et des missions de l’entité Data, la faisabilité des projets se base sur la synergie de trois entités distinctes qui travaillent ensemble tout au long de la durée de vie d’un projet Data (de la phase de cadrage des initiatives, aux phases d’expérimentation, de passage en pilote et d’industrialisation – voir notre article Datalab, Datafab… Comment repousser ses limites ?). On parle alors du triptyque DSI, Data Lab et équipes métiers. L’équipe IT, ou Direction des Systèmes d’Information, est généralement composée de Data Architects, de Data Enginers et de DevOps, soit de profils informatiques techniques à l’ère du Big Data. Les équipes métiers sont les entités de l’organisation qui regroupent les équipes opérationnelles comme les Directions Marketing, RH, Production, Qualité, R&D, etc. Et c’est bien la synergie de ces trois entités qui garantit le cadrage précis des besoins, le déploiement des projets Data et une bonne conduite du changement embrassée par tous. Swiss Life, par exemple, a décidé de créer deux entités : un département Data Science avec des Data Scientists et des Data Analysts ; et un Data Lab transverse pluridisciplinaire qui intègre la DSI, les Product Owners, les Ingénieurs BI et des représentants Data de chaque direction, afin d’embarquer toute l’entreprise dans cette dynamique Data.

En parallèle de l’organisation même des équipes, on distingue deux types d’usages des données qui orientent les organisations : un usage interne et un usage externe de la donnée. L’usage interne de la donnée concerne par exemple le secteur de la Banque et de l’Assurance qui collecte la donnée pour l’exploiter à des fins qui lui sont propres, c’est à dire dans le cadre de la gestion client et de la gestion des risques, par exemple. De son côté, une entreprise comme Groupe Unify dans le domaine des activités médias numériques présente à la fois un usage interne de la donnée (mesure de l’audience, évaluation de la qualité des contenus publiés, etc.) mais aussi un usage externe de la donnée avec un business model à part entière basé sur la monétisation des données de trafic. Ces deux usages distincts sont donc à prendre en compte dans le déploiement des projets Data, notamment en termes de contraintes réglementaires (consentement client, optin marketing, etc.) nécessaires au respect du RGPD (Règlement Général de Protection des Données) applicable depuis Mai 2018 (voir notre article Les 5 concepts-clés du RGPD version 2018).

Idéation de cas d’usage

Il existe des cas d’usage « imposés » qui sont indispensables vis-à-vis des réglementations dans certains secteurs, comme par exemple, la détection de fraude par les banques. D’autres cas d’usage sont considérés plutôt comme des « classiques » car ils existent depuis plusieurs années, comme dans le domaine du marketing par exemple avec les scores d’appétence client, la détection de moment de vie, etc. Afin de compléter leur portfolio et de répondre aux besoins de tous les métiers en valorisant leurs données, les entités Data travaillent également sur des cas d’usage « innovants » dans leurs secteurs qui aideraient à la construction de l’image de l’entreprise – amélioration de service client, activités RH, etc.

Dans un premier temps, les initiatives Data semblent naître des Data Labs qui possèdent une prise de recul plus aisée par rapport aux enjeux opérationnels à court terme que rencontrent les métiers. Comme le dit Clémence Panet Amaro (La Banque Postale), le Data Lab peut être considéré comme un “cabinet de conseil interne et gratuit” qui permet d’identifier et de développer des projets Data à forte valeur ajoutée potentielle. Si ce n’est fait en parallèle, c’est souvent dans un second temps que les équipes métiers, une fois les premières “success stories” et ROI mis en lumière, auront une vision plus claire des retours sur investissements potentiels pour pouvoir proposer eux-mêmes des initiatives. Dans ce sens, chez Swiss Life, les métiers sont par exemple invités une fois par an à pitcher pour présenter leurs projets Data et les résultats atteints ou espérés et ainsi encourager les initiatives Data au sein des autres entités.

Le Groupe Unify travaille principalement sur trois types de cas d’usage liés au cœur de métier digital – audience, contenu et publicité. Concernant l’audience, il s’agit de la définition des types de persona et de leurs préférences en termes de fond et forme du contenu ; mesure de la performance des contenus (engagement de l’audience), choix des canaux de distribution pour optimiser leur performance ; analyse sémantique du contenu (key words, etc.) ; optimisation de la place d’enchère des publicités.

Critères de choix et de priorisation des cas d’usage

Nos panélistes s’accordent sur l’importance de trois critères à prendre en compte : la qualité de la donnée (disponibilité, accessibilité), le potentiel ROI (retour sur investissements) dégagé ainsi que l’implication des équipes qui reste la condition ultime, et pourtant la moins tangible, de la réussite d’un projet Data. En phase d’expérimentation, le calcul du ROI reste pourtant complexe à anticiper selon les cas d’usage. La définition d’un ROI pour un cas d’usage sur la détection de fraude, par exemple, peut être estimée en fonction de la fraude et des amendes qui pourront être évitées. A contrario, un cas d’usage sur la qualité de service, elle-même basée sur la satisfaction ou la fidélité client est plus complexe à définir, car les résultats sont par nature visibles à moyen ou long-terme donc difficilement anticipables en termes de calcul de ROI. Même si le ROI est considéré comme un critère très important dans le choix et la priorisation des cas d’usage, il pourrait également freiner l’innovation si l’absence d’un ROI quantifié est un critère éliminatoire pour le lancement d’une expérimentation.

Afin d’ajouter un critère supplémentaire à la hiérarchisation des cas d’usage, Dounia Zouine (Groupe Unify) nous rappelle que l’interprétabilité des modèles (voir notre Livre Blanc 2018, “IA, explique-toi !”) est également un critère à considérer car il facilite, aux phases suivantes, la prise en main des projets Data par les équipes et la bonne compréhension des modèles en supprimant l’effet “black box” guettant tout projet d’intelligence artificielle. Et en effet, cela n’est pas optionnel car l’interprétation des modèles reste une condition essentielle pour évaluer et valider les outputs des projets Data. Par ailleurs, la manière de structurer l’équipe du Data Lab peut favoriser l’accélération des projets. Au sein de l’entité Data du Groupe Suez, une même équipe travaille par exemple sur deux canaux d’accélération de projets distincts. Le premier “stream de tests” est constitué de sessions de six mois pendant lesquelles des initiatives Data sont lancées. Il s’agit dans ces cas-ci de sujets majoritairement bottom-up, c’est à dire initiés par les équipes métiers. On pourrait rapprocher cet environnement de celui d’un incubateur. Si les projets ne sont pas concluants, ils sont arrêtés ou mis en pause s’ils sont des opportunités pour un temps futur. En parallèle, un second “stream de transformation” de projets Data majoritairement top-down (projets sponsorisés par le top management et à destination