PAT-chercheur à la Faculté des géosciences et de l’environnement et directrice du Swiss Geocomputing Centre, Marj Tonini travaille depuis près de 20 ans sur la modélisation des risques naturels, tels que les feux de forêt ou les glissements de terrain, la production de scénarios prédictifs ou encore les changements d’affectation des territoires
Elle fournit notamment des cartes d’occurrences de risques utilisées par les gouvernances locales pour la gestion de zones sensibles situées sur leur territoire.
Un afflux de données offrant la possibilité d’intégrer l’IA aux modèles
Au début de ses recherches, Marj Tonini travaillait sur des modèles de cartographie « classiques ». Ces modèles sont basés sur des connaissances environnementales solides, où chaque zone est décrite par de nombreux paramètres (pente, nature du sol, couverture de la végétation etc.). Pour définir un risque de feu de forêt par exemple, on intègre ces variables en les pondérant selon leur influence relative sur ce phénomène de risque (par exemple le type de végétation ou l’occupation du sol). Marj Tonini nous explique que « ces modèles ont le désavantage de dépendre de la subjectivité des scientifiques, qui décident du poids attribué aux différentes variables, et qu’ils nécessitent beaucoup de temps pour tester diverses configurations« .
Marj Tonini s’est intéressée à l’intégration du machine learning, au moment où plusieurs éléments favorisaient cette démarche : « L’utilisation de l’intelligence artificielle dans mes modèles a été rendue possible grâce à l’augmentation massive des données à disposition (p.ex. base de données spatio-temporel en format digital, images satellitaires), ainsi qu’à l’accroissement de la puissance de calcul des ordinateurs. »
Les algorithmes utilisés rendant les calculs beaucoup plus efficients, lui ont permis de jongler plus facilement avec les différentes variables afin d’affiner ses modèles. Les prédictions sur des zones pour lesquelles il manquait de données directes (cf encadré) ont ainsi pu être améliorées. De plus, la possibilité de traiter des paramètres aléatoires, permet de fournir des résultats sous forme de cartes d’occurrences de risques (estimer la probabilité qu’un incendie se déclare dans une zone donnée avec un certain marge d’incertitude) qui améliorent l’exploitation des informations pour les utilisateurs finaux (gouvernances communales, régionales par exemple).
L’utilisation de l’IA a une marge de progression dans le domaine des géosciences
Selon Marj Tonini, « l’utilisation de l’IA dans le domaine des géosciences est encore marginale (<20% des recherches en géosciences) ». Ce pourcentage devrait augmenter avec l’intégration de l’apprentissage des techniques de machine learning et de la science des données dans les formations de base des étudiant.e.s et doctorant.e.s. Elle-même enseigne à des étudiant.e.s de niveau master et constate leur envie d’intégrer l’IA dans leurs travaux. « Il est toutefois nécessaire d’attirer leur attention sur les écueils à éviter. Il faut par exemple disposer de suffisamment de données, partir de questions pertinentes, ne pas confondre corrélations et causalité et pouvoir vérifier les résultats sur des nouvelles données », illustre la chercheuse.
Par ailleurs, Marj Tonini relève que « l’IA peut être un moyen intéressant pour initier des collaborations, par exemple entre personnes qui maîtrisent un domaine scientifique et des spécialistes en machine learning, ou entre scientifiques de domaines différents utilisant les mêmes algorithmes pour l’intégration de l‘IA dans leur recherche ». Elle-même collabore avec des scientifiques issus de différents domaines et au sein de diverses institutions et pays.
D’une première publication à un standard européen
« Un des exemples que je peux citer est celui de ma collaboration avec le Centre International pour le Monitorage Environnemental en Italie (CIMA) », explique Marj Tonini. « Un de leur représentants m’avait contactée à la suite de ma première publication sur l’utilisation du machine learning dans un modèle destiné à analyser les risques de feux de forêt. Il disposait de données collectées sur 30 ans, et voulait savoir si elles pouvaient être introduite dans mon modèle », se rappelle-t-elle.
Le groupe du CIMA (secteur « Gestion des risques d’incendie et conservation des forêts ») avait conçu un modèle déterministe très sophistiqué qu’ils souhaitaient comparer aux modèles intégrant le machine learning. Les deux approches ont pu être comparées sur la base de 80% des données existantes, en faisant des projections sur un 20% des donnée indépendantes. Le modèle basé sur l’AI a obtenu des résultats bien meilleurs que le modèle déterministe plus « classique ». Marj Tonini nous indique que suite à ces résultats « le modèle a finalement été adopté comme standard pour la cartographie du risque incendie élaborée au niveau locale et européen par le centre CIMA ».