Data Engineer

Découvrez nos data engineer !
Data Engineer

Je travaille au sein d’équipes multidisciplinaires, avec à la fois des Data Scientists et des Data Engineers sur des projets innovants en Intelligence Artificielle. En général, sur un projet je commence par développer des Data Pipelines qui vont permettre à la donnée d’être acheminée, je réponds également aux besoins de mes clients, en essayant d’être le plus proche des besoins métiers.

Témoignage

Coline, Data Engineer

Diplômée de l’ESIEA, Coline  a débuté sa carrière en tant que Data Engineer chez Cellenza avant de rejoindre Quantmetry

Je travaille au sein d’équipes multidisciplinaires, avec à la fois des Data Scientist et des Data Engineer sur des projets innovants en Intelligence Artificielle. En général, sur un projet je commence par développer des Data Pipelines qui vont permettre à la donnée d’être acheminée, je réponds également aux besoins de mes clients, en essayant d’être le plus proche des besoins métiers.

Ou contactez-nous à recrutement@quantmetry.com

Sujets de stage

Pour vous permettre de compléter votre formation, nous vous proposons 4 sujets de stage afin d'approfondir vos connaissances dans l'univers du big data et de l'intelligence artificielle :

Modélisation d'algorithmes

Qui sommes-nous ?

Nous pourrions commencer en nous présentant comme un des leaders sur le marché international du conseil en data, avec un chiffre d’affaire défiant ceux des G.A.F.A. Mais non. Nous préférons mettre en avant notre cadre de travail, nos réussites et surtout nos consultants. Aller venez, c’est par là…

Quantmetry, c’est plus d’une soixantaine de personnes qui travaillent de concert pour accompagner nos clients dans leurs réflexions, P.O.C., industrialisation autour de la Data, l’Intelligence Artificielle, le Machine Learning et la Big Data. Nous sommes ce qu’on peut appeler communément un cabinet de conseil pure player en Data.

N’étant pas sectorisés, nous intervenons sur différents sujets (voici une petite liste non-exhaustive) :

– La maintenance prédictive, 

– La segmentation clients, le scoring,

– La détection de fraude, de corruption, de blanchiment d’argent,

– Le développement des architectures de plateformes Data,

– L’analyse de textes et d’images médicales.

Vous avez dit challenge ?

Suite à l’identification d’un sujet de recherche/paper, vous serez en charge de l’implémentation de l’algorithme dans une librairie C/C++ puis « wrapper » en Python. Dans quel but me direz-vous ? L’idée ici sera d’utiliser des algorithmes qui n’existent pas dans la communauté Python pour, par la suite, générer des modèles d’IA innovant.

Ce projet représentera pour vous une opportunité de pouvoir travailler en parfaite autonomie sur un sujet technique d’actualité au sein d’un environnement apprenant et valorisant vos compétences.
Le but à terme sera de rendre cette librairie en open-source et mise à disposition sur GitHub (Doc, test packaging).

Serez-vous l’élu(e) ?

Nous recherchons tout simplement un étudiant suivant une formation technique en école d’ingénieur ou d’informatique ayant une forte appétence pour évoluer sur des sujets de développement et de mathématiques et ayant idéalement une expérience (projet ou stage) dans le monde de la recherche

Nous vous demanderons d’utiliser Python même si ce n’était pas l’année du serpent, des connaissances solides sur ce langage vous seront donc demandées.

Au cas où vous seriez le mouton noir à 5 pattes -> un niveau solide en C/C++ sera apprécié pour la partie performance du projet à des fins d’optimisation.

Enfin, nous vous proposons en parallèle de cette mission de R&D de pouvoir intervenir sur des sujets liés à nos missions en Data Engineering/Data science

Alors quoi ?! Vous n’avez pas encore postulé ? Mais venez vite nous rejoindre pardi !

De l'exploration des données sur notebooks à l'industrialisation des modèles avec JPMML

Qui sommes-nous ?

Nous pourrions commencer en nous présentant comme un des leaders sur le marché international du conseil en data, avec un chiffre d’affaires défiant ceux des G.A.F.A. Mais non. Nous préférons mettre en avant notre cadre de travail, nos réussites et surtout nos consultants. Aller venez, c’est par là…

Quantmetry, c’est plus d’une soixantaine de personnes qui travaillent de concert pour accompagner nos clients dans leurs réflexions, P.O.C., industrialisation autour de la Data, l’Intelligence Artificielle, le Machine Learning et la Big Data. Nous sommes ce qu’on peut appeler communément un cabinet de conseil pure player en Data.

N’étant pas sectorisés, nous intervenons sur différents sujets (voici une petite liste non-exhaustive) :

– La maintenance prédictive, 

– La segmentation clients, le scoring,

– La détection de fraude, de corruption, de blanchiment d’argent,

– Le développement des architectures de plateformes Data,

– L’analyse de textes et d’images médicales.

Vous avez dit challenge ?

Votre mission sera d’industrialiser des POC d’intelligence artificielle basés sur des notebooks Jupyter appliqué à un sujet de data science et/ou structure de code réutilisable. Ce travail permettra la fluidification entre l’étape du POC et celle de la production. Voici un bref aperçu du contexte du projet :

  • Phase de POC : le Data Scientist travail sur Jupyter notebook en Python pour plus de flexibilité/agilité et rapidité d’exécution.
  • Phase d’industrialisation : le besoin de performance et supervision de l’application requière l’utilisation d’une plateforme robuste type Java ou Scala.

La problématique du projet : désiloter les deux univers, qui utilisent des écosystèmes différents (Python vs Java/Scala). L’idée est de réutiliser le travail réaliser en phase de POC / amélioration du model pour la phase de production.

Concrètement qu’allez-vous donc faire ?

Nous vous proposons d’utiliser des approches différentes :

  • Soit Jupyter Notebook at scale -> du développement à l’exploitation en production (cf. article Netflix)
  • Soit transposer le modèle réaliser dans un écosystème (plateforme de développement/ dans un autre (plateforme de production Java/Scala) via JPMML.

Qui sera l’élu(e) ?

Nous recherchons tout simplement un étudiant suivant une formation technique en école d’ingénieur ou d’informatique ayant une forte appétence pour évoluer sur des sujets de Data Science.
Une parfaite maîtrise de Python est requis pour évolue à travers ce projet. De plus, étant donné ce dernier, nous vous demanderons un niveau à minima intermédiaire en Java et/ou Scala.

Enfin, nous vous proposons en parallèle de cette mission de R&D de pouvoir intervenir sur des sujets liés à nos missions en Data Engineering/Data Science.

Alors quoi ?! Vous n’avez pas encore postulé ? Mais venez vite nous rejoindre pardi !

La Data Science appliquée aux données sensibles

Qui sommes-nous ?

Nous pourrions commencer en nous présentant comme un des leaders sur le marché international du conseil en data, avec un chiffre d’affaire défiant ceux des G.A.F.A. Mais non. Nous préférons mettre en avant notre cadre de travail, nos réussites et surtout nos consultants. Aller venez, c’est par là…

Quantmetry, c’est plus d’une soixantaine de personnes qui travaillent de concert pour accompagner nos clients dans leurs réflexions, P.O.C., industrialisation autour de la Data, l’Intelligence Artificielle, le Machine Learning et la Big Data. Nous sommes ce qu’on peut appeler communément un cabinet de conseil pure player en Data.

N’étant pas sectorisés, nous intervenons sur différents sujets (voici une petite liste non-exhaustive) :

– La maintenance prédictive, 

– La segmentation clients, le scoring,

– La détection de fraude, de corruption, de blanchiment d’argent,

– Le développement des architectures de plateformes Data,

– L’analyse de textes et d’images dans le cadre de la lutte contre le cancer du sein.

Pourquoi recrutons-nous ?

Les données sont aujourd’hui au centre de l’attention et plus particulièrement les données dites « sensibles » qui nécessitent un traitement spécial. Dans le cadre de notre développement nous recherchons un étudiant qui pourra prendre part à un projet en Data Engineering, concernant les données sensibles, qui représente un véritable challenge technique, sur une période de 6 mois (pouvant déboucher sur un CDI).

Vous avez dit « challenge » ?

Oui j’ai bien dit ça et un vrai de vrai en plus : L’objectif de l’étude sera d’explorer les méthodologies, concepts et technologies de Data Science appliqués à la conception de modèles de machine learning sur des données sensibles (santé/HDS, militaire, renseignement, etc.).

De par le niveau de criticité du service opéré, l’infrastructure bâtie devra être en haute disponibilité et hautement sécurisée. La cryptographie et l’anonymisation des informations échangées seront votre quotidien. Ce dernier point est extrêmement important. L’utilisation d’algorithmes de hachage sera une nécessité pour conserver les patterns contenus dans les données initiales en exposant une donnée anonymisée aux algorithmes de machine learning.

Une petite contrainte vous sera imposée (sinon c’est trop facile) : le fait de ne pas pouvoir utiliser le Cloud Computing du fait du caractère sensible des données.

Qui sera l’élu(e) ?

Nous recherchons tout simplement un étudiant suivant une formation technique en école d’ingénieur ou d’informatique ayant des connaissances en architecture des systèmes d’informations pour concevoir et mettre en œuvre une plateforme Big Data scalable ex-nihilo on premise. Et ayant l’habitude d’utiliser des technologies type back-end (Java, Python, Scala, Spark, Bash…). De plus nous vous proposons en plus de cette mission de R&D de pouvoir intervenir sur des sujets liés à nos missions en Data Engineering/Data Science.

Ce projet représentera pour vous une opportunité de pouvoir travailler en parfaite autonomie sur un sujet technique et sociétal d’actualité au sein d’un environnement apprenant et valorisant vos compétences.

Alors quoi ?! Vous n’avez pas encore postulé ? Mais venez vite nous rejoindre pardi !

IoT Data Pipeline with Apache

Qui sommes-nous ?

Nous pourrions commencer en nous présentant comme un des leaders sur le marché international du conseil en data, avec un chiffre d’affaire défiant ceux des G.A.F.A. Mais non. Nous préférons mettre en avant notre cadre de travail, nos réussites et surtout nos consultants. Aller venez, c’est par là…

Quantmetry, c’est plus d’une soixantaine de personnes qui travaillent de concert pour accompagner nos clients dans leurs réflexions, P.O.C., industrialisation autour de la Data, l’Intelligence Artificielle, le Machine Learning et la Big Data. Nous sommes ce qu’on peut appeler communément un cabinet de conseil pure player en Data.

N’étant pas sectorisés, nous intervenons sur différents sujets (voici une petite liste non-exhaustive) :

– La maintenance prédictive, 

– La segmentation clients, le scoring,

– La détection de fraude, de corruption, de blanchiment d’argent,

– Le développement des architectures de plateformes Data,

– L’analyse de textes et d’images médicales.

Vous avez dit challenge ?

Et oui, nous avons bien dit cela !

Le projet ici sera d’extraire la valeur dans les données issues du monde de l’IoT, en travaillant sur l’ensemble de la chaine de traitement, dont voici les grandes étapes :

  • L’ingestion aussi bien en streaming qu’en Batch (Apache NiF),
  • Le processing (Spark, Apache Beam)
  • La création des features qui seront utilisés pour créer un modèle de Machine Learning
  • Utilisation du modèle pour faire des prédictions en lien avec le cas d’usage traité (détection d’anomalies, détection fraude, optimisation de la fabrication/consommation électrique…)

Diverses autres sources de données pourront être croisées de type météo, INSEE… pour affiner la prédiction du modèle.

Concrètement qu’allez-vous donc faire ?
Et bien concrètement, vous allez créer un pipeline de bout en bout avec des outils open source Apache et cela à travers :

  • L’implémentation de briques en open source par la fondation Apache : Kafka, NiFi, Spark…
  • Le cloud computing sur Google ou AWS

Le langage de programmation qui sera utilisé pour ce projet sera Python et/ou Scala.

Qui sera l’élu(e) ?

Nous recherchons tout simplement un étudiant suivant une formation technique en école d’ingénieur ou d’informatique ayant de solides connaissances sur Java/Scala ou Python. De plus nous vous proposons en plus de cette mission de R&D de pouvoir intervenir sur des sujets liés à nos missions en Data Engineering/Data Science.

Ce projet représentera pour vous une opportunité de pouvoir travailler en parfaite autonomie sur un sujet technique et sociétal d’actualité au sein d’un environnement apprenant et valorisant vos compétences.

Alors quoi ?! Vous n’avez pas encore postulé ? Mais venez vite nous rejoindre pardi !

Processus de recrutement

Parce qu’être candidat n’est pas un métier, nous souhaitons que toute personne postulant chez Quantmetry reçoive un retour constructif en temps et en heure, lui permettant ainsi d’avoir plus de visibilité et de travailler sur ses axes d’améliorations.

PR_data engeneer

Voir les autres profils

Vinh, Data Scientist

Diplômé de l’École nationale des ponts et chaussées, Vinh est Consultant Data Scientist depuis 2 ans et demi chez Quantmetry. Qu’est ce qu’une journée type dans la vie de d’un Data Scientist ? Allez venez c’est par là !

Jehan, Data Consultant

Diplômé de l’ENSTA Paristech en gestion de l’énergie et d’un M2 de l’université Paris 1- Panthéon Sorbonne de conseil en stratégie, Jehan a démarré dans l'audit et l’analyse de donnée avant de s’orienter vers du conseil en Data. Il a Rejoint Quantmetry en 2018 en tant que Data Consultant, vous avez envie de savoir à quoi ressemble une journée en tant que Data consultant ? Allez venez c’est par là !

Coline, Data Engineer

Diplômée de l’ESIEA, Coline a débuté sa carrière en tant que Data Engineer chez Cellenza avant de rejoindre Quantmetry. Vous aussi vous avez envie de savoir à quoi ressemble une journée en tant que consultant data engineer ? Allez venez c’est par là !

Olivier, Data Architect

Diplômé de l’EFREI, Olivier a évolué dans diverses entreprises dans le domaine de la connaissance client et de la Business intelligence. Il est aujourd’hui Consultant Data Architect chez Quantmetry. Ça vous parle ? Allez venez c’est par là !

Martin, Manager

Diplomé de l’EISTI, Martin a commencé sa carrière en Business Intelligence, il a commencé à s’intéresser aux problématiques Big Data quelques temps avant d’avoir rejoint Quantmetry. Aujourd’hui il est manager sur la partie Analytics et Big Data. Vous avez envie de savoir à quoi ressemble une journée en tant que Manager chez Quantmetry ? Allez venez c’est pas là !