Laboratoire MRM groupe Systèmes d’Information  

Contact : Corinne Janicot – 

Description: Sciences de l’Information et Intelligence artificielle – Machine Learning et Intelligence Artificielle pour l’analyse des données massives Big Data.

Adresse postale : Place Eugène Bataillon – CC 19001 – bâtiment 19 – 34095 Montpellier Cedex 5

Description de l’expertise autour de l’IA  :

Le laboratoire MRM s’intéresse à différents aspects de l’intelligence artificielle en sciences de l’information, en lien notamment avec l’analyse des données massives Big Data.

Dans le cadre de la thèse de Maximilien Dossa encadrée par Corinne Janicot et soutenue en 2019, un guide méthodologique a ainsi par exemple été proposé pour l’aide à la modélisation et au traitement des données massives.

Ce guide méthodologique est mis à disposition des entreprises pour aider à l’accès, à la compréhension et à l’analyse de données massives. Cet outil répertorie les principales méthodologies de Machine Learning et d’Intelligence Artificielle permettant l’analyse des données Big Data en tenant compte de leurs spécificités (véracité, variété, visibilité, valeur…).

La conception de cette solution a nécessité une large revue de la littérature des méthodologies de Machine Learning et d’Intelligence Artificielle généralisée ainsi qu’une analyse d’observations terrain de leur utilisation. Ces méthodologies concernaient en particulier les points suivants :

  • L’analyse de données et la modélisation (Réseaux de neurones artificiels (RNA), Séparateur à Vaste Marge (SVM), Forêts aléatoires (RF-CART)…),
  • Le traitement des données non structurées et l’extraction d’information (analyse sémantique, analyse des sentiments, TextMining, lemmatisation…),
  • L’imputation de données mixtes (imputation stationnaire, imputation par régression stochastique, imputation multiple – algorithme Missforest…),
  • L’enrichissement des données et le traitement des données erronées (triangulation, apprentissage automatique, loi de Bendfort, modèle probabiliste d’enrichissement de données, probabilistic programming…).