Niklas Linde est géophysicien. Il s’intéresse plus particulièrement aux processus environnementaux en lien avec l’hydrogéologie.
Son intérêt pour l’utilisation de l’apprentissage profond a commencé début 2017 avec pour objectif de mieux intégrer les contraintes géologiques dans les modélisations inverses1.
Les modélisations hydrogéologiques sont intéressantes pour étudier les flux souterrains (écoulement des eaux souterraines, transport de contaminants p.ex.). Comme les données ne couvrent pas l’entier des volumes étudiés, il est nécessaire d’y intégrer de la géostatistique : attribution à chaque point d’une fonction statistique pour les différents facteurs mesurés (perméabilité, conductivité, etc.). Ceci permet de déduire ces valeurs pour les autres points de proche en proche, afin d’obtenir finalement une vision complète de la zone étudiée. En complexifiant les calculs, ce processus augmente considérablement le temps nécessaire pour obtenir des résultats (réalisations) et limite la possibilité de tester de multiples hypothèses.
Apprendre à l’IA à reconnaître et générer des structures géologiques
L’idée originale de son collègue Eric Laloy a été d’utiliser les algorithmes de modèles génératifs profonds, (comme par exemple, les applications qui créent des nouveaux visages à partir d’images de millions de visages), pour générer des nouvelles images géologiques avec des caractéristiques similaires à celles d’images existantes (images d’entraînement). Dans le cadre des recherches de Niklas Linde et ses collaborateurs, les images d’entraînement, sont constituées par exemple d’affleurements rocheux, qui représentent une bonne indication de la nature du sous-sol environnant. Les algorithmes ont été entraînés grâce à une multitude de telles images pour qu’ils apprennent à représenter ces structures et leurs propriétés.
Les applications de cette méthode sur des modélisations d’aquifères (structures géologiques contenant de l’eau de manière permanente ou temporaire) ont montré des résultats supérieurs à ceux obtenus avec des méthodes plus classiques. Niklas Linde ajoute : « Les valeurs probabilistes obtenues via ces modélisations rendent les résultats potentiellement plus exploitables pour les utilisateurs sur le terrain (on peut prédire avec quelle probabilité le sous-sol d’une zone donnée renferme telle ou telle propriété géophysique) ». L’objectif pour la suite est d’améliorer les algorithmes afin de diminuer le temps nécessaire à leur entraînement, et de rendre les modèles encore plus précis.
Sceptique au départ
Niklas Linde déclare : « Avant cette recherche, je ne pensais pas que le machine learning puisse être très utile dans le domaine de la géophysique ». Les modèles réalisés à partir des données et des modèles physiques lui semblaient en effet suffisamment précis et préférables, par rapport à une approche basée sur les données. Confronté à des modèles de la subsurface de plus en plus complexes, il a fait partie des précurseurs de l’utilisation de l’apprentissage profond dans le domaine (cf encadré). Le développement de l’utilisation de l’IA dans les géosciences et les progrès réalisés par la suite montrent que le coût d’intégration du machine learning dans un modèle complexe, est largement compensé par les avantages en termes de capacité à représenter des relations complexes et des tester une grande quantité des modèles différents.
Un rôle de précurseur
Niklas Linde et ses collègues ont fait partie des précurseurs de l’utilisation de l’apprentissage profond dans les géosciences pour générer, avec des modélisations inverses, des modèles géologiquement réalistes de la subsurface qui sont en accord avec les données géophysiques. Lors de la soumission de leur premier article décrivant cette approche en 2017, l’éditeur a refusé de le publier, car cette approche ne leur est pas apparue pertinente. L’article a finalement été accepté par un autre éditeur. Le deuxième article sur ce sujet a aussi été refusé avant d’être accepté en 2018 après une re-soumission. Actuellement les publications sur l’utilisation de l’apprentissage profond dans les géosciences sont nombreuses.
- La modélisation inverse consiste à partir de la récolte de données en surface ou dans des forages, puis d’effectuer une modélisation de la forme et des propriétés du sous-sol pouvant satisfaire ces données. ↩︎