Eyram Espoir Tetshie, lauréate du Datathon OCDE-HCR 2025
Exploiter les données afin de mieux comprendre et de répondre aux besoins des enfants déplacés. C’est ce défi qu’ont relevé Eyram Espoir Tetshie, élève-ingénieure en 3e année à l’ENSAI, et son co-équipier William Kokou Amedanou. Leur équipe est une des deux lauréates du premier Datathon lancé en avril 2025 par l’Agence des Nations Unies pour les réfugiés (UNHCR) et l’Organisation de coopération et de développement économiques (OCDE).
Les gagnants ont été invités à présenter leur projet “Multidimensional Vulnerabilities and Child Health in Uganda” au Forum International sur les Statistiques Migratoires (IFMS) qui s’est tenu à Malmö du 16 au 18 juin 2025. A son retour, Eyram Espoir Tetshie a répondu aux questions de l’ENSAI.
Eyram, peux-tu présenter le Datathon OCDE–HCR, organisé pour la première fois cette année et mettant en compétition une cinquantaine d’équipes ?
Eyram Espoir Tetshie : Le Datathon vise à encourager des solutions innovantes en incitant les participants à analyser les ensembles de données de UNHCR Microdata Library. En mettant l’accent sur les enfants déplacés et ceux des communautés d’accueil, le Datathon cherche à découvrir des informations exploitables par le biais d’approches internationales et multidimensionnelles, en s’attaquant à des défis communs.
Le Datathon met l’accent sur le besoin critique d’une analyse nuancée des données afin d’explorer les disparités, les tendances et les liens affectant les enfants déplacés. William Kokou et moi-même nous sommes tout de suite retrouvés dans la thématique : mêler sciences des données, enjeux sociaux et migration. C’était une grande opportunité d’appliquer ce qu’on apprend.
Vous venez tous les deux de deux grandes écoles différentes : en quoi vos profils ont-ils été complémentaires ?
Mon co-équipier est à la Paris School of Economics, avec un bagage pour les enjeux sociaux et une solide formation en économétrie. De mon côté, à l’ENSAI, je suis plus orientée statistiques, data science. Cette complémentarité nous a permis de croiser nos compétences en statistiques et en économie, et d’aborder le projet sous des angles variés.
Que peux-tu nous dire si votre projet et sur les techniques et outils mobilisés ?
Dans le cadre de notre projet intitulé Multidimensional Vulnerabilities and Child Health in Uganda, nous avons exploité les données de l’enquête 2018 Uganda Joint Multi-Sector Needs Assessment Survey pour identifier les facteurs influençant la santé des enfants au sein des communautés déplacées et hôtes.
Nous avons conçu un indice de santé composite permettant d’évaluer la vulnérabilité infantile. Grâce à cet indice, nous avons appliqué des techniques de clustering afin de regrouper les ménages en deux catégories : ceux dont les enfants présentent une forte vulnérabilité, et ceux dont l’état de santé est relativement meilleur.
Ensuite, nous avons effectué des analyses de régression économétrique du machine learning afin d’identifier les variables qui affectent et prédisent le plus fortement la vulnérabilité de la santé des enfants et la manière dont les interactions entre ces variables augmentent le risque.
Nous avons principalement travaillé avec R. Côté méthodes, on a combiné du clustering, des modèles économétriques et du machine learning.
Avez-vous rencontré des difficultés au cours du projet ?
Les données n’étaient pas toujours centrées sur l’enfant, nous avons donc dû recourir à des proxys. Il a donc fallu faire preuve de créativité pour construire des indicateurs pertinents. Aussi, certaines dimensions importantes n’étaient pas mesurées clairement. Il a fallu composer avec cela, tout en restant rigoureux.
Comment s’est passée votre présentation à Malmö, dans le cadre de l’IFMS ?
C’était l’aboutissement du projet. Présenter notre travail à l’IFMS 2025, devant des experts du monde entier (statisticiens, économistes, institutions internationales…), c’est une chance incroyable. L’événement était centré sur les données migratoires et les innovations en statistique migratoire plus précisément avec les modèles de machine learning. On a reçu des retours très positifs sur notre projet, mais aussi des pistes concrètes pour aller plus loin. Et on a pu échanger avec d’autres équipes, chercheurs et décideurs publics.
Quels sont tes projets pour les mois à venir ?
Je termine bientôt mon stage de fin d’études chez Quadratic Data en tant que data scientist. Pour la suite, rien n’est encore défini avec certitude, mais restez connectés ! Une chose est sûre : je compte continuer à apprendre et à me challenger avec les données.
Une dernière chose à retenir de cette expérience unique ?
Oui : les données ne racontent rien toutes seules. Ce qui compte, c’est la manière dont on les interroge, dont on les relie aux enjeux sociétaux. Le Datathon nous a également permis de prendre conscience de la complexité de travailler sur des données incomplètes. Cela a renforcé notre capacité à faire preuve de rigueur méthodologique.
Merci et bravo, Eyram.