DECATHLON DIGITAL
L’entité Data de Decathlon coordonne l’ensemble des activités visant à l’accélération et la généralisation de l’usage et la valorisation des données.
Decathlon vise à devenir la meilleure plateforme digitale de sport et l’écosystème ouvert le plus performant au monde. Nous voulons permettre à nos clients de vivre l’expérience Decathlon à travers de nombreuses expériences locales centrées sur le sport en connectant de nombreux acteurs et services tiers, de manière sécurisée et performante.
Nos équipes digitales à Lille, Paris, Amsterdam (et plus encore) qui rassemblent plus de 5000 collaborateurs sont unies pour construire et faire évoluer des produits digitaux avec l’objectif de toujours offrir la meilleure valeur à nos utilisateurs. Présents dans plus de 70 pays, Decathlon est engagé dans l'innovation, la durabilité et la satisfaction des clients.
Tu seras en charge de projets qui ont le potentiel de définir l'avenir du sport.
C'est vraiment une chance de façonner l'industrie du sport grâce aux données et à l'IA !
Dans le cadre de l’ouverture d’un poste en interne, nous recrutons un-e Junior Machine Learning Engineer en stage conventionné, basé-e, à Paris.
LE SUJET DE STAGE
Optimisation d’une pipeline de prévision de ventes
Notre équipe Demand & Assortment Planning développe des pipelines de Machine Learning afin de fournir des prévisions de la demande de l’ensemble des articles vendus par Decathlon afin d’optimiser la gestion des commandes auprès de nos fournisseurs et de nos stocks dans nos entrepôts et magasins. Ces pipelines doivent être les plus stables et robustes possibles afin d’alimenter les outils utilisés quotidiennement par les experts de la supply chain en données prévisions fiables et précises.
L'objectif de ce stage est d'explorer des pistes d'amélioration potentielle de notre pipeline pour réduire les coûts et l'empreinte environnementale tout en optimisant le temps de calcul grâce à l'utilisation de nouvelles technologies et outils telles que mixed precision training, polars ou rapids.
TES RESPONSABILITÉS
En tant que Machine Learning engineer junior au sein de l'équipe Data Demand & Assortment Planning, tu auras les responsabilités suivantes :
- Tu collecteras des données sur l'utilisation des ressources du serveur (CPU, RAM, GPU, etc.) de notre pipeline actuel (référence)
- Tu effectueras une refonte d’une partie de notre pipeline de données pour utiliser Polars/Polars GPU/Rapids au lieu de PySpark et mesureras son impact sur les ressources en vérifiant la cohérence des résultats entre les deux frameworks
- Tu effectueras une refonte des jobs de training/inférence pour exécuter ces tâches sur FP32/FP16/INT8 et mesurer son impact sur les ressources et les prédictions
- Tu créeras un script de benhmark qui nous permettra de démarrer cela pour comparer les deux approches (baseline et une nouvelle)
- Tu communiqueras efficacement l'analyse et les résultats par le biais de visualisations, de documents et de présentations aux parties prenantes techniques et business.
Le périmètre technique :
- Python
- AWS (S3, Sagemaker)
- Jupyter
- Databricks
- Spark
- Airflow
CE DONT TU AURAS BESOIN POUR RÉUSSIR
- Tu maîtrises la programmation en Python, via une expérience d'au moins de deux ans, pour manipuler des données et tirer des enseignements sur des grands volumes de données
- Tu as une expériences dans les librairies PyTorch et PyTorch lighting
- Tu comprends les principes de software engineering
- Tu as des connaissances sur les librairies de manipulation de données à grande échelle, comme pyspark, pandas ou polars, ou sur les outils de workflows en data science (Databricks workflow, Sagemaker, MLflow, etc)
- Tu as d'excellentes compétences interpersonnelles, analytiques, de communication et de présentation - la capacité de communiquer des résultats complexes de manière simple.
- Tu aimes découvrir et résoudre des problèmes, chercher de manière proactive à clarifier les exigences et les orientations, être autonome et prendre des responsabilités lorsque cela est nécessaire.
- Tu es particulièrement sensible à l’impact de la pratique du sport dans ta manière de travailler !
- Tu as envie de rejoindre une entreprise à impact positif (#Tech4Good)
- Cerise sur le gâteau : tu as déjà travaillé sur des problématiques de forecast !
CE QUE NOUS OFFRONS