Campus Triolet, Bat 36, SC36.08
Jonathan Dubois – Institut de Science des Données de Montpellier
Vous tentez d’étudier un processus sans a priori spécifique et vous avez mesuré un nombre important de variables que vous pensez potentiellement impliquées. Comment trier et garder l’information pertinente ? Venez découvrir trois approches de Machine Learning pertinentes dans ce domaine : les méthodes de Régression Régularisée (LASSO, Ridge, ElasticNet), les Arbres de Décision et la Forêt Aléatoire.
Objectifs :
• Estimer et évaluer des modèles linéaires régularisés, d’arbres et de forêt aléatoire.
• Identifier les variables pertinentes à partir des résultats de ces modèles.
Prérequis :
• Quelques notions en statistique (tests de base, modèle de régression linéaire, ANOVA)
• Les notions basiques du langage R.
• Ordinateur personnel équipé de R (version ≥ 4.4.x), des packages nécessaires (indiqués après inscription), et d’un IDE tel que RStudio.
Possibilité de venir à partir de 13h15 pour une assistance à l’installation des outils.
Il existe une autre session de formation abordant des méthodes statistiques plus traditionnelles : Comparaison de modèles et réduction de dimensions. N’hésitez pas à vous inscrire.
Inscription gratuite mais obligatoire

