Thèse soutenue par Nicola DELUIGI, le 16 février 2018, Institut des dynamiques de la surface terrestre (IDYST)
Dans les environnements alpins, le pergélisol de montagne est défini comme un état thermique du sol et correspond à tout matériau de la lithosphère qui maintient une température égale ou inférieure à O°C pendant au moins deux ans. Sa dégradation peut conduire à une activité croissante de chutes de blocs, à des accélérations des glaciers rocheux et à une augmentation des taux de transfert de sédiments.
Au cours des 20 dernières années, les connaissances sur ce phénomène ont considérablement augmenté grâce à de nombreuses études et projets de suivi, qui ont révélé une distribution spatiale extrêmement discontinue et complexe du phénomène, en particulier à la microéchelle (échelle d’une forme géomorphologique; dizaines à plusieurs centaines de mètres).
L’objectif de cette recherche était l’étude systématique et détaillée des potentialités offertes par une approche axée sur les données dans le cadre de la modélisation de la distribution du pergélisol de montagne. Les algorithmes d’apprentissage automatique (\textit{machine learning}) sont capables de considérer un plus grand nombre de paramètres que les approches classiques. La distribution du pergélisol peut être modélisée non seulement en utilisant des variables topoclimatiques (altitude, radiation solaire, etc.), mais aussi en tenant compte de la présence et de l’absence connues du pergélisol (observations de terrain).
Collectées dans un secteur des Alpes occidentales suisses, ces dernières ont été cartographiées sur la base d’investigations de terrain (données thermiques et géoélectriques), d’interprétation d’orthophotos et d’inventaires de glaciers rocheux. Un jeu de données a été construit à partir de ces évidences de terrain et complété par des prédicteurs environnementaux et morphologiques. Les données ont d’abord été analysées avec des techniques montrant la pertinence des variables permettant d’identifier la contribution statistique de chaque facteur de contrôle et d’exclure les prédicteurs non pertinents ou redondants. Cinq algorithmes de classification appartenant aux domaines des statistiques et de I’apprentissage automatique ont ensuite été appliqués et testés : la régression logistique, le SVM linéaire et non linéaire, les perceptrons multicouches et les forêts aléatoires. Ces techniques déduisent la relation qui existe entre de facteurs de contrôle du pergélisol et son absence et présence certaines directement à partir de données fournies. Elles permettent ensuite de prédire I’occurrence du pergélisol là où elle est inconnue.
Les performances de modèles obtenus ont été vérifiées à I’aide d’indicateurs statistiques qui ont généralement indiqué la bonne qualité des résultats obtenus. En plus de ces mesures statistiques, une évaluation qualitative a été réalisée et se base sur l’expertise géomorphologique. Les forêts aléatoires se sont révélées être la technique produisant le meilleur modèle. Ainsi, l’approche axée sur les données offre un aperçu des incertitudes de la modélisation, qui informent sur la localisation des secteurs les plus incertains dans lesquels de futures campagnes de terrain méritent d’être menées afin d’améliorer la fiabilité des cartes produites.
Finalement, les forêts aléatoires ont démontré leur efficacité dans le cadre de la modélisation de la distribution du pergélisol grâce à des résultats comparables à la réalité de terrain. L’emploi de variables environnementales illustrant la microtopographie du relief et les caractéristiques du sol (tels que les indices de courbure, le NDVI et la granulométrie) favorise la prédiction de la distribution du pergélisol à la microéchelle, avec des cartes présentant des variations de la probabilité d’occurrence du pergélisol sur des distances de quelques dizaines de mètres. Par exemple, dans certains éboulis, les cartes illustrent une probabilité plus faible dans la partie amont de la pente, ce qui s’avère cohérent avec les observations de terrain.
La limite inférieure du pergélisol a ainsi été automatiquement reconnue à partir des évidences de terrain fournies à l’algorithme. Enfin, la haute résolution du jeu de données (10 mètres) a permis d’élaborer des cartes présentant une distribution spatiale du pergélisol moins optimiste que celle offerte par les modèles spatiaux classiques. La prédiction du pergélisol a en effet été calculée sans utiliser des seuils d’altitude (au-dessus desquels on peut trouver du pergélisol) et respecte ainsi mieux la représentation de la forte discontinuité du pergélisol de montagne à la microéchelle.