Deuxième semestre

Méthodes de rééchantillonnage

Objectifs

Mobiliser ses connaissances de probabilité et de statistiques inférentielles pour la définition d’une méthode de rééchantillonnage adaptée à l’inférence considéréernMettre en œuvre une méthode de rééchantillonnagernLire et discuter un texte scientifique utilisant des méthodes de rééchantillonnage à des fins statistiques.rn

Plan

L’inférence statistique repose généralement sur la connaissance des distributions de probabilités des statistiques. Si la loi d’une statistique est inconnue, une méthode de rééchantillonnage cherche à approcher par simulation de Monte Carlo cette distribution conditionnellement aux données observées. Le principe de cette technique est de substituer à la loi de probabilité inconnue une distribution empirique construite à partir de l’échantillon d’apprentissage.rnL’objectif de ce cours est de présenter les principales méthodes de rééchantillonnage : les tests par permutations avec une introduction aux tests multiples, et le bootstrap. Le cours alternera description des procédures, preuves mathématiques, exercices et études de cas pratiques. Le cours portera essentiellement sur des modèles statistiques indépendant et identiquement distribués. En fonction du temps, nous verrons des extensions du Bootstrap appliquées par exemple aux modèles hétéroscedastiques (Wild Bootstrap), aux données dépendantes (Block Bootstrap, Subsampling) ou massives (Bag of Little Bootstrap).rnUne liste d’exercices non corrigés est fournie pour permettre aux étudiants de s’exercer en supplément des coursrn

Prérequis

probabilité, statistique inférentielle, régression, apprentissage supervisé, séries temporelles, calcul bayésien