Cette publication est également disponible en : English
La Médaille Ian McHarg 2022 de l’EGU a été décernée à Mikhail Kanevski pour son exceptionnel travail dans le domaine du traitement des données environnementales, intégrant des géostatistiques, des algorithmes issus du machine learning et d’autres transformations numériques.
Mikhail Kanevski est professeur honoraire de l’IDYST dans le groupe de recherche Geosciences and Knowledge Discovery in Data.
Les intérêts scientifiques du prof. Kanevski couvrent un large éventail de sujets : la science de l’information géographique, la modélisation environnementale, les statistiques spatiales, la prévision des séries chronologiques, l’apprentissage automatique (machine learning) et l’exploration de données. Les principales applications concernent les risques naturels, la pollution et les analyses et évaluations des énergies renouvelables. A l’occasion de l’attribution de cette médaille, M. Kanevski nous parle de son domaine de recherche.
Vous êtes titulaire d’un doctorat en physique des plasmas. Pour quelle raison vous êtes-vous orienté vers les géosciences par la suite ?
L’événement déclencheur a été l’accident de la centrale nucléaire Tchernobyl. À la suite de cet événement, de nombreuses questions ont été adressées aux scientifiques afin de déterminer comment gérer les dégâts occasionnés et la pollution qui s’en est suivie. J’ai ainsi été amené à modéliser les risques environnementaux de pollution par la radioactivité.
Ensuite la curiosité scientifique et l’aspect très interdisciplinaire du domaine des géosciences et de l’environnement m’ont incité à rester dans ce domaine. Douze ans après ma thèse, j’ai effectué une habilitation dans le domaine de l’environnement et analyse de données.
Quel a été votre parcours au sein de la FGSE ?
Dès 1993, j’ai beaucoup collaboré avec Michel Maignan, (actuellement professeur honoraire de l’ISTE), avec lequel nous avons développés de nombreux projets en lien avec l’analyse de données environnementales et risques. En 2004 j’ai été engagé à l’UNIL dans la FGSE nouvellement créée. Mes projets FNS étaient orientés vers des questions fondamentales d’analyse et modélisation de données en utilisant statistique, géostatistique et apprentissage par machine. Les applications des projets était suivantes: modélisation topo-climatique et différents types de risques naturels: les avalanches, les feux de forêt, les glissements de terrain, les pollutions (l’air, les sols, indoor radon). Nous avons notamment établi des cartes de risques qui ont pu servir de référence pour les décisions prises dans les organes de gestion du territoire. Ensuite les projets ont évolué en parallèle avec les technologies et outils à disposition pour s’orienter vers le traitement de données de plus en plus nombreuses et l’intelligence artificielle.
Comment votre domaine de recherche a-t-il évolué durant ces 10 dernières années ?
Les outils ont bien sûr beaucoup évolué : le nombre de données à disposition ainsi que leur qualité a fortement augmenté grâce aux satellites et aux réseaux de monitoring. En Suisse notamment la densité et la qualité des données est très bonne. En parallèle les outils informatiques et les potentiels de calcul ont permis de traiter ces données de manière de plus en plus complexe et de plus en plus fine. Durant ma carrière en FGSE, le domaine des data sciences a connu différentes vagues alternant enthousiasme et désappointement. Actuellement il est devenu un outil « de base » pour beaucoup de chercheurs.
Quelles sont les limites des data sciences ?
Quelle que soit la performance d’analyse, le plus important est la question et l’hypothèse de départ. Il faut que le problème soit clairement identifié et la question posée correctement pour que le traitement des données apporte une réponse valable. Ensuite il faut veiller à la qualité et à la pertinence des données récoltées, et savoir comment interpréter les relations obtenues entre les divers paramètres étudiés. Les liens de cause à effet aujourd’hui peuvent être déduits automatiquement des résultats obtenus via le traitement des données et les algorithmes avancés. Dans ce sens il est important de pouvoir s’appuyer sur une bonne connaissance des règles et équations de géophysique, géochimie ou autre, qui définissent les mécanismes et permettent une bonne interprétation des résultats. L’interprétabilité et l’explicabilité des résultats de la science des données (comment et pourquoi un algorithme prend une décision en particulier), notamment ceux obtenus par le machine learning, constituent l’un des principaux défis actuels.
Ce prix est une reconnaissance pour le travail de toute une équipe qui a beaucoup contribué au domaine. Les nombreuses thèses et projets encadrés ont continuellement fait avancer ma recherche. Je me réjouis de voir la nouvelle génération de chercheuses et chercheurs qui arrive maintenant avec un bagage très intéressant et une formation complète à la fois en géosciences et en analyse des données. Cela va sans doute faire évoluer le domaine et la manière d’appréhender les questions. Au cours de ces années, l’accompagnement des jeunes chercheurs a été autant un plaisir qu’un travail.
Mikhail Kanevski recevra sa médaille le 23 mai prochain, lors de l’assemblée générale de l’EGU qui se tiendra à Vienne.