Automatisation de la détection d’anomalies
“Le pôle Modèles Portefeuilles fait partie du département Modélisation de la direction des Risques du groupe bancaire BPCE. Le coeur du travail de ce pôle repose sur la projection des risques de crédit. La couverture du risque de crédit se divise en deux parties : les pertes attendues et les pertes inattendues.
Nous nous concentrerons sur les pertes attendues dans le cadre de ce projet. Notre projet statistique fait écho à un premier travail de détection des valeurs aberrantes au niveau des variables.
L’objectif est d’approfondir la détection à l’échelle des observations, afin notamment de garantir la qualité des données. Pour y arriver, l’objectif principal est l’implémentation d’un algorithme d’Isolation Forest.
La base de données fournie représente des contrats du portefeuille Hors-Retail, c’est-à-dire des entreprises avec un chiffre d’affaires supérieur à trois millions d’euros. Ces observations sont notamment réparties selon la méthodologie de provisionnement statistique IFRS9. La norme IFRS9 (International Financing Reporting Standard) est une norme comptable qui segmente les contrats en trois catégories selon les pertes de crédit attendues.
Dans ce rapport, nous présentons les grandes lignes de la réalisation de ce projet statistique. Il se découpe en quatre parties (auxquelles s’ajoutent l’introduction et la conclusion) : une première prise en main des données, l’implémentation de l’Isolation Forest, la recherche de méthodes concurrentes, et la comparaison avec une base de données issue de l’arrêté 2022.
Les analyses statistiques ont été réalisées sous le logiciel R. Afin que le code soit ré-exploitable par les équipes du pôle Modèles Portefeuilles du groupe bancaire BPCE, il a été automatisé. Pour ce faire, nous avons créé des fonctions qui produisent les analyses statistiques fréquemment utilisées au cours de ce projet.”