Gaulthier, un stage de fin d’études en data science chez Decathlon
Gaulthier Voland, ingénieur diplômé de l’ENSAI en 2024, a réalisé son stage de fin d’études chez Decathlon. Durant 6 mois, il a travaillé à la modélisation de la chaine de valeur afin d’améliorer la disponibilité des produits en magasin tout en limitant le stock. Désormais data scientist chez le géant du sport, il revient sur cette mission menée entre la France et l’Italie.
La troisième année du cursus ingénieur de l’ENSAI s’achève par un stage de fin d’études. Les élèves-ingénieurs mettent en application l’ensemble des compétences acquises au cours de leur scolarité dans l’environnement professionnel de leur spécialisation : Génie statistique dans le cas de Gaulthier.
Ma mission : « Réconciliation hiérarchique de prédictions de séries temporelles »
Gaulthier Voland : “Pour mon stage de fin d’études, j’ai été recruté par Decathlon, et j’ai intégré l’équipe Forecast, une des unités de la Value Chain. Divisée en différents pôles, celle-ci se concentre spécifiquement sur la modélisation de la demande sur un périmètre défini afin d’optimiser au mieux la production ainsi que l’acheminement des produits sur l’ensemble de la supply chain de l’entreprise. Or, du fait des spécificités des différents modèles mis en place au sein de ces pôles, des écarts de prédictions entre les différents niveaux de la hiérarchie de la chaîne de valeur peuvent apparaître, accentuant les risques de rupture ou de surstock.
Mon stage, sous l’intitulé « Réconciliation hiérarchique de prédictions de séries temporelles », avait donc pour objectif de réconcilier ces prédictions, c’est-à-dire produire une modélisation unique pour l’ensemble de la chaîne de valeur afin d’améliorer la disponibilité des produits tout en limitant le stock.
Pour ce faire, j’ai été accompagné par Alexandre Mariller, un Data Scientist senior, qui a su m’aiguiller tout au long de ces six mois.
Outils, méthodes et montée en compétences
Au début de la mission, j’ai d’abord réalisé un état-de-l’art des différentes méthodes de réconciliation afin de me familiariser avec celles-ci, mais également afin de déterminer les approches les plus adaptées aux données de Decathlon.
J’ai ensuite implémenté en PySpark différentes méthodes (des algorithmes linéaires tels que Top-Down, Bottom-Up ou encore MinT ainsi que certaines approches à base d’arbres de décision comme RandomForest ou XGBoost), et les ai adaptées aux contraintes de la chaîne logistique. J’ai alors pu comparer leurs performances, à la fois sur leurs résultats selon différentes métriques, mais également sur leur complexité de calcul, et donc sur leurs conséquences économique et écologique ; l’idée étant d’obtenir un modèle sobre et efficace.
Pour que mon stage se réalise dans les meilleures conditions, j’ai été accompagné dans ma montée en compétences sur les bons usages de Git, Databricks, PySpark et AWS. J’ai pu profiter de formations en interne, notamment pour me familiariser avec l’écosystème utilisé par les équipes data en interne : Poetry, Docker, MLFlow, ainsi que les templates mis à disposition pour développer des projets de Data Science. J’ai donc découvert la joie des fichiers de configuration et de toute la minutie nécessaire pour mettre un projet en production.
J’ai également énormément appris aux côtés des autres Data Scientists, Data Analysts, Machine Learning Engineers et Data Engineers de l’équipe Forecast. Que ce soit en discutant directement avec eux de leurs missions, ou lors de Tech Reviews (points réguliers durant lesquels chaque équipe présente ses dernières implémentations pour partager son expérience et recueillir des axes d’amélioration), j’ai pu découvrir de nouvelles méthodes de Data Science et ainsi avoir davantage d’idées concernant la contribution que je souhaitais et pouvais apporter.
Au cours de mon stage, j’ai eu à partager mes avancées avec le leader data de l’équipe Forecast. En plus de pouvoir mettre en avant certaines difficultés, liées notamment à la structure de certaines tables de données, il a également été question de l’avenir du projet de réconciliation. Vu que ce dernier se base sur les modèles de prédiction développés par les autres pôles, il a été décidé que la solution que je proposais attendrait que tous ces modèles soient mis en production avant d’envisager de la lancer en production également. Autrement dit, mon stage a pu confirmer que la réconciliation était un bon moyen d’homogénéiser les modèles de prédiction, et donc la gestion des stocks ; mais qu’il fallait pour cela disposer de solutions de prédiction efficaces.
Un cocktail de data, d’international… et de sport !
Durant mon stage, j’ai eu l’occasion de rejoindre une partie de nos équipes basée à Milan. En dehors des techniques de Data Science, c’est donc d’un véritable esprit d’équipe dont j’ai pu profiter. Chacune des personnes que j’ai rencontrées a su se montrer disponible pour m’aiguiller, mais également écouter mes propositions.
Et comme Decathlon, c’est avant tout la passion du sport, il est évident que cette partie a été mise en avant tout au long du stage : depuis les questions lors de l’entretien jusqu’aux créneaux dédiés à la pratique d’activités physiques. Il n’y a évidemment aucune obligation, et tous les niveaux sont les bienvenus pour (re-)découvrir un sport (course à pied, escalade, badminton, …).
Outre les avantages à la pratique régulière d’une activité physique, ces moments permettent surtout de renforcer les liens avec ses coéquipier·es et de rencontrer d’autres équipes ! J’ai également pu assister à des webinaires sur la thématique du sport, dont un sur les différences (notamment physiologiques) entre les hommes et les femmes, et ce que cela implique pour la conception des produits. Ce stage a aussi été l’occasion d’échanger avec les équipes produits pour comprendre leurs problématiques et découvrir les futures sorties.

Sortie sportive avec les collègues de Decathlon
Enfin (et surtout!), j’ai pu devenir ambassadeur KIPRUN, la marque experte dédiée à la course à pied. C’est pour moi l’occasion de tester de nouveaux produits, et d’aider à leur conception, en plus de pouvoir porter la même tenue que les athlètes élites !
Globalement, le fait de lier mon métier à ma passion me permet de mieux me projeter dans ma mission, et d’échanger au quotidien avec des personnes expertes dans des domaines qui m’intéressent tout particulièrement.
Un stage de pré-recrutement
À la suite de mon stage, j’ai décidé de poursuivre l’aventure chez Decathlon, en tant que Data Scientist dans le projet Cold Start. Encore rattaché à l’équipe Forecast, je travaille désormais spécifiquement sur la prédiction de demande des nouveaux produits, ceux qui n’ont donc aucun historique de vente. J’ai donc pour mission principale de travailler à l’implémentation et à la mise en production d’un modèle capable d’estimer au mieux la demande vis-à-vis des nouveaux produits pour la saison prochaine. Soucieux de développer un modèle qui répond à un besoin fonctionnel, nous collaborons régulièrement avec les équipes produits pour identifier au mieux leurs problématiques et développer la solution la plus pertinente.
Retour sur mon parcours à l’ENSAI
Comme une bonne partie de ma promotion, j’ai intégré l’ENSAI après une prépa MP. Bien plus intéressé par les maths et l’informatique que par la physique, je préférais intégrer une école spécialisée dès la première année plutôt qu’une école plus généraliste. J’ai longuement hésité entre l’ENSAI et une autre école, davantage spécialisée en programmation informatique. Ce qui a motivé mon choix, c’est la possibilité d’acquérir à l’ENSAI un socle théorique solide et complet, indispensable pour devenir un Data Scientist intègre. Je me suis dit qu’il était plus complexe d’assimiler ces bonnes pratiques par un apprentissage en autodidacte, contrairement à la programmation qui se prête davantage à une démarche exploratoire.
Après ces deux premières années à l’ENSAI, j’ai eu à faire face au même dilemme qu’en sortie de prépa : choisir entre une filière davantage axée sur l’informatique (Ingénierie des données) ou bien continuer à me spécialiser dans la compréhension de modèles complexes à travers la filière Génie statistique. Cette fois-ci, en plus des arguments qui m’avaient permis de me décider deux ans auparavant, je me suis également basé sur cette nouvelle appétence développée au cours des différents projets vis-à-vis de la modélisation statistique et des modèles de Machine Learning.”
Vous souhaitez devenir data scientist ? Plus d’informations sur le cursus ingénieur de l’ENSAI