Statistique appliquée aux sciences de l'ingénieur

Responsable(s) Céline HARTWEG-HELBERT, Alexandre SAIDI
Cours ⋅ 16 hBE ⋅ 12 h

Objectifs de la formation

L'objectif de ce cours est de fournir les outils classiques de la statistique mathématique qui permettent d'aborder le choix du modèle probabiliste, son estimation et son évaluation. Nous nous intéresserons tout particulièrement au modèle linéaire et à ses extensions dans le contexte d'apprentissage statistique en grande dimension (LASSO, RIDGE, PCR PLS), au modèle logistique et aux modèles à base d'arbres (CART, RF, Boosting etc.). Le but de ce cours est aussi d'assurer une formation à la manipulation de données et à la mise en oeuvre pratique des modèles étudiés. Pour cela, une partie conséquente du cours est orienté vers la mise en oeuvre des différents modèles à l'aide du logiciel R à travers l'étude d'un grand nombre d'exemples.

Mots-clés

Regression linéaire et logistique. Sélection de modèles. Plans d'expériences. Régression pénalisée L1, L2. Modèles à base d'arbres.

Programme

  1. Rappel sur la régression linéaire. Validités et limites de la méthode. Sélection de modèles.
  2. Plans d'expériences : criblage et surface de réponses
  3. Régression logistique
  4. Apprentissage en grande dimension (régression LASSO, Ridge etc, modèles à base d'arbres)
  5. Classification

ACTIVITES PRATIQUES Les trois BE seront consacrés à l'apprentissage des techniques des modèles de régression sur des supports informatiques performants (logiciel R) et à des études de cas.

Compétences visées

  • Savoir reconnaître différentes classes de problèmes de l'apprentissage statistique.
  • Savoir mettre en oeuvre des modèles de base de l'apprentissage statistique et valider leur pertinence.
  • Savoir proposer des méthodes d’apprentissage adaptées à la grande dimension
  • Savoir utiliser le logiciel R.

Évaluation

Note finale = 60% Note de savoir + 40% Note de savoir-faire Note de savoir-faire = 100% contrôle continu Note de savoir = 100% examen terminal