IA Strategy
21/10/2020

La data est au coeur du monde post-covid, retour sur le salon BigData Paris


Auteur : Paul Rengade
Temps de lecture : 4 minutes
Quantmetry.com : La data est au coeur du monde post-covid, retour sur le salon BigData Paris

C’est avec 300 autres speakers que nous avons partagé notre savoir faire, nôtre Quant Approach devant 11 000 participants le 14 & 15 septembre au palais des congrès pour le salon BigData Paris. Voici en bref 3 thématiques explorées durant les conférences et quelques Quant Stories pour les illustrer.

 

 

Vers le Cloud et le Multicloud

 

Qu’est-ce que je fais de mon Hortonworks? – Benoit Petitpas – DataValue Consulting 

 

Depuis la fusion entre Hortonworks (HW) et Cloudera, la question de sortir d’HW se pose puisque son support s’arrêtera en 2021. Benoit Petitpas de DataValue s’est posé la question de ce que les entreprises pourraient faire entre rester sur HW, passer sur Cloudera, développer sa propre solution ou passer sur le Cloud. C’est finalement cette dernière option qui a été retenue en termes de prix, de niveau de service et avec une complexité de mise en œuvre réduite par l’existence de solutions de migration. 

Cette conviction du Serverless, nous la portons chez Quantmetry et accompagnons nos clients de manière agnostique sur AWS, Google Cloud Plateforme (GCP) et Azure ou des solutions open source. Voici l’une de nos Quant Stories sur le Serverless.

 

Comment gagner en agilité dans sa stratégie multicloud? – Frédéric Marsaud & Antoine Gouedard – Oracle

 

Ainsi, avec la mise en concurrence de nombreux cloud providers, le choix peut s’avérer difficile. Pour la majorité, il existe une voie médiane: le Multicloud. Selon Gartner 75% des moyennes et grandes entreprises auront adopté une stratégie multicloud ou hybride.  Prenant les devants, Oracle et Azure annoncent leur interopérabilité depuis juin 2019. Quel est le bénéfice d’une telle solution? Pour Frédéric Marsaud d’Oracle, c’est de pouvoir utiliser le meilleur des deux mondes en termes d’outils et de prix grâce à une connexion de 10Gb/sec par port sans passer par internet. 

D’autres liens entre cloud providers existent et vous pouvez approfondir ici celui que nous avons creusé entre GCP et Azure

 

 

L’évolution du métier de Data Scientist l’heure de l’industrialisation 

 

Le cycle de vie d’un projet de Machine Learning, du design à la mise en production – Arnold Zephir  – Prevision.io

 

Il y a quelques années, il suffisait d’avoir un DataLab pour être perçu comme innovant. Aujourd’hui, l’enjeu est d’industrialiser ses cas d’usage data. Arnold Zephir de prevision.io, s’est ainsi proposé de démystifier le cycle de vie d’un projet de data science. Aujourd’hui, un Data Scientist n’est pas là pour simplement développer un modèle et optimiser les hyperparamètres avec du feature engineering. Bien souvent ce n’est pas la complexité de l’algorithme qui fait la différence mais le dialogue avec les métiers, l’accès à la donnée et sa préparation, qui sont clef, le tout avec une exigence élevée de vitesse delivery davantage que la complexité de l’algorithme. Arnold témoigne, “j’ai eu parfois mal au cœur de sortir une régression linéaire ou une random forest” pour répondre rapidement aux besoins métier. 

Cette vitesse d’exécution va de paire avec un autre élément clé pour nous: le cadrage, qui doit intégrer les éléments business, data et IT. Avant, pendant et après, nous sommes convaincus que c’est la bonne compréhension des besoins métier qui assure le succès du Data Scientist.

 

En IA, devenez tout, sauf Data Scientist ! – Jérémy Harroch & Sacha Samama – Quantmetry

 

Pourtant, selon Sacha Samama et Jérémy Harroch de Quantmetry, ce n’est pas le métier que vous devriez choisir en 2020. En effet, à l’heure de l’industrialisation, c’est le Machine Learning Engineer  (MLE) qui prend le relais. Sa fonction est de faire le trait d’union entre le monde de la data science et du DevOps. Cette observation se retrouve lorsque nous interrogeons nos clients  sur leur recrutement data. Aujourd’hui la ressource rare n’est plus le Data Scientist mais le Data Engineer. Ceux qui sauront faire les deux ont l’avenir devant eux

 

 

Le Covid: les directions data sont à la hauteur du challenge

 

Le COVID a-t-il eu raison de l’IA? – Nicolas de Bellefonds – BCG Gamma

 

L’avenir semble pourtant incertain pour la data science. Nicolas de Bellefonds de BCG Gamma, confirme cela car ses clients ont arrêté certains modèles entraînés sur des données d’un passé qui ne ressemble plus à l’avenir. Il parle même de COMEX qui envisagent d’arrêter les investissements sur les algorithmes de Machine Learning. Il propose une solution qui est d’ajouter des données externes. Cette solution pose néanmoins le problème de l’ingestion des données, du volume de données à traiter et de la volatilité. En effet, les modèles ainsi ré-étalonnés sont volatiles et imposent un temps de réaction élevé de la part de l’entreprise.

Cette solution, nous l’avons testée dès avril avec nos clients que ce soit l’optimisation sous contrainte ou la mise en place de processus réactifs dans les organisations, et nous pensons que cela peut apporter une vraie plus value sur les projets de prévisions. 

 

Ainsi, nous sommes nombreux à croire en l’avenir de la donnée. Nous pensons même que la data doit jouer un rôle pour aider les entreprises à orienter leur stratégie de reprise

D’ailleurs, après avoir interrogé une quarantaine de CDO au sein de notre Baromètre des directions data, nous constatons que, malgré la crise, 68% des entreprises sondées préservent leur budget data. C’est un message fort envoyé par les Comités de Direction : la valorisation du patrimoine de données est désormais considérée comme un enabler clé pour construire l’entreprise compétitive de demain.