Machine Learning for Natural Language Processing (NLP)
- Type de matière
- STATISTIQUE
- Correspondant
- François PORTIER
- Module
-
UE-MSD03 : Statistics for New Data
- Nombre d'ECTS
- 2
- Code matière
- MSD 03-2
- Répartition des enseignements
-
Heures de cours : 18
- Langue d'enseignement
- Anglais
Objectifs
– Comprendre les fondements des modèles NLP récents (modèles de langage, transformateurs, GPT)
– Mettre en œuvre des pipelines de traitement du langage naturel
– Concevoir des solutions pour l’extraction d’informations textuelles
Plan
Le cours introduira les principales notions de NLP et détaillera les approches modernes de NLP basées sur l’apprentissage automatique, en passant par les points suivants : représentation des mots, classification des textes, étiquetage des mots, modélisation du langage, transformateurs et modèles de langage de grande taille, génération de textes.
Les cours mêleront étroitement cours magistraux et travaux pratiques guidés qui seront complétés par de petits projets personnels poursuivant les sessions de travaux pratiques guidés.
Prérequis
– Fondements de l’apprentissage automatique (probabilités/statistiques, optimisation, descente de gradient, fonction de perte, etc.)
– Bonne connaissance de Python
– Familiarité avec tensirflow/keras et/ou pyTorch