FAIRiser les données du réseau d’observatoires de la zone critique Français (OZCAR) : cas d’utilisation de l’ontologie I-ADOPT
Salle 104 du bâtiment 11 dit le château, 2 Place Pierre Viala Campus La Gaillarde, 34000 Montpellier
SEmantic web SeminAr MontpEllier
(1) News du W3C en 10 minutes Pierre-Antoine CHAMPIN, W3C / INRIA / Université de Lyon
(2) FAIRiser les données du réseau d’observatoires de la zone critique Français (OZCAR) : cas d’utilisation de l’ontologie I-ADOPT par Charly COUSSOT, IRD Université Grenoble Auvergne Rhône Alpes
Le système d’information (SI) Theia/OZCAR est une initiative nationale conçue pour soutenir la découverte, l’accès et la réutilisation des données environnementales in-situ collectées par les observatoires français et leurs partenaires internationaux. Cela inclut les données des 22 observatoires de l’infrastructure française de recherche sur les zones critiques (OZCAR-RI), qui surveillent la zone critique de la Terre dans toute une série de compartiments environnementaux. Historiquement, ces données étaient gérées par des systèmes indépendants, chacun ayant ses propres formats, vocabulaires et protocoles d’accès, ce qui créait des obstacles importants à l’interopérabilité et à la recherche interdisciplinaire.
Pour remédier à cette fragmentation, le SI Theia/OZCAR a été co-développé avec la communauté scientifique depuis 2017, dans le but de fédérer des données de séries temporelles hétérogènes dans une infrastructure unifiée conforme aux principes FAIR (Trouvable, Accessible, Interopérable, Réutilisable) (Wilkinson et al., 2016). Ce travail soutient des initiatives nationales et européennes plus larges, notamment l’infrastructure de recherche française Data Terra et la plateforme de données OneWater, ainsi que des efforts internationaux tels que eLTER-RI, en permettant l’échange et l’intégration normalisés des données du système terrestre.
Pour atténuer l’hétérogénéité des informations, un élément central de ce système est un modèle de données partagé – appelé « modèle pivot » – qui permet une structuration cohérente des métadonnées depuis la description des jeux de données jusqu’aux observations individuelles. Ce modèle s’appuie sur des normes de métadonnées reconnues (ISO 19115, O&M, DataCite) (Braud et al., 2020) et est associé à un service de vocabulaire contrôlé, le Thésaurus Theia/OZCAR. Ce thésaurus, aligné sur les ontologies SKOS et I-ADOPT (Coussot et al., 2024), permet la décomposition sémantique des noms de variables hétérogènes et parfois complexe tout en améliorant les fonctionnalités de découverte des données, et l’alignement entre les thésaurus.

