“Un doctorat, c’est l’occasion de travailler en profondeur sur un sujet qui nous passionne”
Syrielle Montariol est post-doctorante à l’Inria : après une thèse en Traitement Automatique du Langage à la Société Générale, ses travaux portent sur l’analyse des médias sociaux. En intégrant la promotion 2017 des ingénieurs de l’ENSAI, elle n’imaginait pourtant pas mener une carrière dans le domaine de la recherche. Retour sur un parcours jalonné de rencontres et d’évènements décisifs.
Premiers pas dans le monde de la recherche
Syrielle Montariol : “J’ai fait une prépa MPSI/MP, au cours de laquelle j’ai découvert la force des statistiques dans le cadre d’un projet ; cela m’a motivée à m’orienter vers une école spécialisée dans ce domaine. L’ENSAI a l’avantage d’offrir une base solide en statistiques, ce qui permet de se démarquer dans le monde professionnel, où beaucoup de data scientists ont principalement une formation informatique.
Pendant ma scolarité à l’ENSAI, je ne m’intéressais pas vraiment à la recherche académique. Je me suis orientée vers la filière Data Science & Gestion des Risques en troisième année du cursus ingénieur.
Le projet statistique sur lequel j’ai travaillé en groupe en deuxième année a remporté le prix du meilleur projet, remis par la Société Française de Statistique (SFdS).
Dans ce cadre, mon groupe a été invité à présenter ses travaux aux Journées de la Statistique, une conférence nationale organisée par la SFdS tous les ans, qui avait lieu vers la fin de ma troisième année à l’ENSAI. À cette occasion, j’ai pu discuter avec les chercheurs sur place, et avec des doctorants passionnés par leur travail.
À travers ces discussions et l’ambiance générale de la conférence, j’ai eu une ouverture sur le monde de la recherche qui m’a beaucoup attirée. Or cela coïncidait avec mon stage de troisième année, que j’effectuais à la Société Générale ; j’ai donc lancé, en partenariat avec cette entreprise et un laboratoire de recherche avec lequel ils collaboraient, un projet de thèse Cifre. C’est un type de contrat long à mettre en place, mais qui permet d’avoir un financement de la thèse – chose souvent ardue à obtenir – et de garder un pied dans le monde de l’industrie.
Ma thèse en Traitement Automatique du Langage, à la Société Générale
Ma thèse est dans le domaine du Traitement Automatique du Langage (TAL), à l’intersection entre le machine learning et la linguistique. Venant de la filière Data Science & Gestion des Risques, j’avais fait peu de machine learning et jamais de text mining en arrivant en thèse ; mais le bagage théorique obtenu à l’école permet de plonger dans ces sujets très rapidement.
Plus spécifiquement, j’ai travaillé sur le changement sémantique : modéliser l’évolution du langage, à travers des word embeddings dynamiques (qui changent au cours du temps). Détecter et modéliser ce phénomène a des applications en linguistique, par exemple en lexicographie, mais aussi en sciences sociales, pour identifier l’évolution de certaines tendances ou mouvements culturels dans des populations.
Je suis désormais en post-doctorat à l’Inria. Mes travaux portent sur l’analyse de médias sociaux ; en utilisant les textes des publications, leurs images, et les réseaux d’interactions entre les utilisateurs, je construis des modèles de détection de contenus haineux ou toxiques : ce sont des modèles multi-modaux, du fait de cette diversité de types de features.
En outre, en m’appuyant sur les travaux de ma thèse, j’identifie les variations dans ces contenus au cours du temps, et entre différents domaines et langues. En effet, les contenus haineux en ligne sont en constante évolution (nouvelles cibles, nouveau lexique…) et les systèmes automatiques de modération nécessitent des mises à jour continuelles pour garder leur efficacité.
Un doctorat : pourquoi pas ?
Faire un doctorat, c’est une des seules occasions de sa vie de travailler en profondeur sur un sujet qui nous passionne. C’est aussi un emploi avec une liberté rare : liberté dans les directions de recherche et les techniques implémentées, mais aussi dans le choix des personnes avec qui collaborer, et dans la façon de travailler. Si vous hésitez, un stage dans un laboratoire de recherche est une bonne ouverture vers ce domaine.
Vous craignez de ne pas aimer travailler trois ans sur un unique sujet ? C’est très rarement le cas ; plutôt qu’un sujet unique, ce sont milles facettes d’un domaine ; vous pouvez partir dans la direction que vous voulez, travailler sur des sujets complètement orthogonaux… Certes, pour valider votre doctorat, il faut rédiger une thèse avec une certaine cohérence, mais tout ce que vous avez fait durant votre doctorat n’a pas besoin d’entrer dans votre manuscrit de thèse.
Vous craignez que ce soit « trop dur » ? Vous allez être une des seules personnes au monde à étudier votre sujet à une telle profondeur. Dans cette situation, toute direction est bonne à explorer ; tout résultat est une pierre ajoutée à l’édifice. Il n’y a pas de “mauvaise” recherche, tant que vous travaillez avec sérieux et éthique.
Vous craignez d’être livré à vous-même pendant trois ans ? Au cours du doctorat, on acquiert une grande autonomie dans le processus de recherche ; mais cela vient progressivement, en étant suivi et guidé de près par les encadrants de thèse. Et c’est là que vient, pour moi, un des conseils les plus importants pour se lancer dans une thèse : le choix des encadrants. Avant même le sujet, un bon encadrant est la meilleure garantie de passer un bon doctorat.”