Prévention du sarcome utérin : un projet de radiomique lauréat du Prix SFdS-ENSAI 2023
Tessa Chevallier, Emma Héard, Lorie Nouzille et Mathilde Vince ont remporté le prix du meilleur projet de statistique de 2ème année pour leurs travaux intitulés “Algorithme diagnostique pour différencier un myome atypique bénin d’un sarcome utérin”, encadrés par Audrey Lavenu, Maîtresse de conférences en biostatistique à l’Université de Rennes et chercheuse à l’IRMAR et au CIC INSERM.
Les quatre Ensaiennes sont actuellement élèves de troisième année à l’ENSAI, cursus ingénieur et data scientist public.
Les lauréates présenteront leur projet lors des prochaines Journées de la Statistique
Dans le cadre de la collaboration entre la Société Française de Statistique (SFdS) et l’ENSAI, un prix pour le meilleur projet statistique de 2ème année est décerné chaque année. Les lauréates sont invitées à présenter leurs travaux lors des 55e Journées de la Statistique de la SFdS qui se dérouleront à Bordeaux du 27 au 31 mai 2024. Les Ensaiennes et leur tutrice Audrey Lavenu verront ainsi leur travail valorisé auprès d’un large public de professionnels de la statistique, issus des sphère privée et publique.
Une présélection de cinq projets a été réalisée par des enseignants-chercheurs de l’ENSAI en juillet 2023 et transmise au jury, présidé par Aurélie Fischer (Université Paris-Cité) et comprenant des spécialistes de la SFdS.
« Ce travail se place dans le contexte de la radiomique, technique d’analyse des images médicales qui permet d’extraire des informations quantitatives sur les caractéristiques des tissus : des méthodes d’apprentissage statistique basées sur ces informations peuvent aider à différencier une tumeur bénigne d’un cancer. Le groupe d’étudiantes a comparé la performance de 3 types de méthodes prédictives, forêts aléatoires, SVM, régression logistique pénalisée, qui ont donné des résultats très prometteurs.”
Le jury souligne la qualité de la rédaction et de l’illustration du rapport, ainsi que la considération de la question de l’imputation des données manquantes, dans ce contexte où l’on dispose de relativement peu de données. Le jury a également apprécié la discussion en fin de rapport : elle démontre le recul des étudiantes sur le travail effectué et ouvre des perspectives intéressantes.
Résumé du projet par les lauréates
“Le sarcome utérin est un cancer agressif qui doit être repéré et traité le plus précocement possible pour maximiser les chances de survie de la patiente atteinte. L’étape du diagnostic est d’autant plus cruciale qu’elle doit permettre de distinguer cette tumeur maligne de son équivalent bénin : le myome.
Depuis plusieurs années, pour aider les professionnels de santé dans ce diagnostic différentiel, des algorithmes visuels de classification sont construits à partir de données cliniques.
Le développement de la radiomique, domaine permettant d’extraire numériquement des caractéristiques précises sur les images d’IRM, offre l’opportunité d’améliorer ces modèles.
Pour évaluer correctement l’apport de la radiomique, les méthodes utilisées doivent être adaptées aux spécificités des études médicales : des échantillons avec un nombre faible d’observations, parfois inférieur au nombre de variables ainsi que des procédures d’échantillonnage particulières et potentiellement génératrices de biais.
La question de l’imputation des données manquantes y est également centrale puisqu’elle permet de conserver un maximum de patientes pour entraîner les modèles. Concernant ces derniers, les algorithmes de machine learning ou incluant une forme de pénalisation sont à privilégier.
Notre étude en a présenté trois – un SVM, une régression Elastic Net et un Random Forest – entraînés sur un jeu de données ayant subi une imputation par la régression.
Chacun des trois modèles a des avantages, mais nous avons retenu particulièrement la régression Elastic Net qui présente le plus faible taux d’erreur et qui permet de bien visualiser l’apport de la radiomique dans la construction d’un modèle diagnostique.
Nous avons été ravies de voir notre sujet valorisé par ce prix. Nous sommes profondément reconnaissantes et motivées d’avoir l’opportunité de présenter notre travail lors de la prochaine édition des Journées de Statistique de la SFdS”.
En savoir plus sur les projets d’étude à l’ENSAI