« L’étude de la démission, aussi appelée analyse de churn (de l’anglais « churn analysis ») est un domaine qui a pour objectif d’évaluer la perte de clients d’une entreprise, d’en comprendre les causes et éventuellement d’effectuer des prédictions, afin notamment de prendre des décisions stratégiques, d’adapter son offre et d’améliorer ses résultats.
L’analyse de churn est très utilisée dans le domaine bancaire, le domaine de l’assurance ou encore la télécommunication car ces activités récoltent par définition un grand nombre de données relativement précises sur leurs clients afin de leur proposer des produits et services adaptés, peu risqués, et rentables pour l’entreprise. De nombreuses recherches ont été faites dans le domaine des télécommunications. Dans notre cas nous nous intéresserons au cas bancaire.
La concurrence est rude et il est aujourd’hui simple de changer de banque ou de contrat d’assurance rapidement sur internet. Il est donc intéressant pour ces entreprises de s’intéresser à la démission de leurs clients grâce aux données dont elles disposent et à des méthodes statistiques et algorithmiques pour aider à la description et à la prédiction.
L’objectif principal est bien sûr de retenir un maximum de clients. Toutefois, l’analyse de churn en général a de multiples avantages : gain de connaissances pour améliorer l’entreprise, meilleure compréhension des clients, réduction du risque et construction d’un avantage concurrentiel.
L’analyse de churn peut prendre plusieurs formes, qui dépendent évidemment des données à disposition. L’idéal est d’avoir des données régulièrement actualisées et riches en informations, mais ce n’est pas toujours possible. Par exemple, on peut s’intéresser à la raison du départ d’un client (passage chez un concurrent, plus besoin du produit/service, etc.) ou encore à des facteurs caractérisant le client (engagement dans l’entreprise, fidélité, rentabilité, etc.). Pour une bonne analyse de la démission, comme pour toute étude statistique, il est donc important d’avoir des données qualitatives et variées : pour cela, les entreprises ont plusieurs outils à leur disposition comme le questionnaire de satisfaction, aujourd’hui systématiquement proposé à un client lorsqu’il décide de mettre fin à un contrat (QCM, texte libre).
Dans le cadre de ce projet, nous avons décidé de nous concentrer sur l’aspect modélisation et prédiction, avec une approche machine learning de la démission traitée de façon binaire. Dans un premier temps nous avons travaillé avec des données numériques en libre accès concernant une base de clients de banque, puis dans un deuxième temps avec des données textuelles (commentaires des clients). Ainsi, l’objectif du projet sera de décrire les données étudiées, de comparer des modèles d’apprentissage supervisé pour la classification binaire et de présenter ces résultats. Pour la partir analyse textuelle, des modèles spécifiques au NLP ont été utilisés ».