Thèse en sciences de l’environnement, soutenue le 25 octobre 2023 par Léa Friedli , rattachée à l’Institut des sciences de la Terre (ISTE) de la FGSE.
Les études géoscientifiques impliquent souvent la résolution de problème dits « inverses », dans lesquels des paramètres et propriétés environnementaux sont estimés sur la base de mesures disponibles et d’hypothèses de départ sur les phénomènes étudiés. Cette thèse se concentre sur l’utilisation de données géophysiques et hydrogéologiques pour déduire les caractéristiques géophysiques (par exemple, la conductivité électrique), géologiques (par exemple, la teneur en argile) ou hydrogéologiques (par exemple, la saturation en eau) sous la surface.
Lors de la résolution de problèmes inverses, il est important d’avoir conscience qu’il existe toujours une incertitude inhérente aux résultats obtenus. Pour y remédier, nous utilisons une approche d’inversion probabiliste qui fournit une gamme de solutions possibles (dite distribution postérieure bayésienne). Dans ce contexte, cette thèse se concentre sur deux questions de recherche principales :
- Comment résoudre efficacement les problèmes d’inversion si les paramètres d’intérêt ne sont pas directement liés aux mesures ?
- Comment combiner les approches d’inversion et d’évaluation des risques pour prédire la probabilité d’occurrence des événements dangereux ?
L’inversion probabiliste repose sur une fonction de vraisemblance, qui quantifie la probabilité qu’un ensemble spécifique de valeurs des paramètres du modèle soit à l’origine des données observées. Dans certains modèles, il est difficile d’évaluer la fonction de vraisemblance en raison de la présence d’une variable latente intermédiaire, qui brouille la relation directe entre les paramètres du modèle et les mesures. Nous considérons d’abord un scénario dans lequel les variables hydrogéologiques d’intérêt ne sont qu’indirectement liées aux mesures géophysiques par l’intermédiaire de propriétés géophysiques latentes.
Dans un second scénario d’intérêt, nous nous intéressons à l’estimation d’hyperparamètres tels que la moyenne et la structure de corrélation du domaine cible lorsque les mesures ne sont qu’indirectement liées à ces hyperparamètres par le biais de propriétés locales du domaine. Le calcul direct de la fonction de vraisemblance n’est possible dans aucun de ces deux scénarios. Pour surmonter cette difficulté, nous investiguons deux méthodes :
- la méthode pseudo-marginale corrélée
- et une approximation gaussienne linéarisée.
Alors que la méthode pseudo-marginale corrélée implique un échantillonnage et un calcul de moyenne sur les variables latentes, l’approximation gaussienne linéarisée repose sur une approximation locale. Dans nos cas d’essai, la méthode pseudo-marginale corrélée apparaît comme une approche généralement applicable et précise. En revanche, l’approximation gaussienne linéarisée est plus efficace sur le plan du calcul, mais au prix d’une perte de précision.
Dans notre deuxième question de recherche, nous nous concentrons sur l’estimation d’événements rares, où l’objectif principal n’est pas d’estimer les paramètres du modèle eux-mêmes, mais évaluer un risque qui dépend de ces paramètres. Un exemple d’évènement dangereux étudié en hydrogéologie est la contamination d’un aquifère, un processus qui est influencé par les propriétés hydrauliques entre la source de contamination et l’aquifère. Lorsqu’il s’agit d’événements rares, il est nécessaire de recourir à des approches spécialisées pour parvenir à une estimation précise de la probabilité d’occurrence. Tout d’abord, nous considérons une méthode de Monte Carlo séquentielle combinée à un échantillonnage par sous-ensembles. Dans cette approche, nous générons des échantillons de manière itérative et les rapprochons progressivement de la région critique associée à l’événement rare en question. Par la suite, nous introduisons une approche basée sur le concept d’énergie libre (Energy-based models; EBM) en utilisant un potentiel de biais pour forcer l’échantillonnage dans une région qui est pertinente pour la quantité d’intérêt.
De manière prometteuse, les deux approches montrent de bonnes performances dans l’estimation précise des probabilités d’événements rares, même lorsqu’ils se produisent à un taux inférieur à un sur un million. En résumé, cette thèse présente des avancées méthodologiques visant à améliorer l’efficacité computationnelle et le réalisme des approches d’inversion probabiliste pour l’estimation ciblée de propriétés et attributs des systèmes environnementaux.