Thèse soutenue par Philipp S. Sommer le 28 février 2020, Institut des dynamiques de la surface terrestre (IDYST)
Les comparaisons données-modèles du climat de l’Holocène (d’il y a 11’700 ans à aujourd’hui) fournissent une base idéale pour évaluer la performance des modèles climatiques en dehors de la plage moderne de variabilité climatique. L’Holocène est assez récent pour que les conditions aux limites et les différents forçages soient bien connus, tandis que les archives paléo-environnementales sont abondantes et datées avec suffisamment de précision pour reconstruire complètement le climat. Jusqu’à présent, les efforts pour reconstruire les changements climatiques de l’Holocène spatialement se sont principalement concentrés sur l’Holocène moyen (il y a environ 6000 ans), mais des divergences significatives ont déjà été identifiées lors des comparaisons données-modèles.
Ces écarts entre les modèles et les données peuvent être étudiés à l’aide de collection de données d’observation couvrant des échelles continentales ou hémisphériques qui nous permettent de reconstruire des caractéristiques climatiques à grande échelle, comme la dynamique atmosphérique ou les gradients de température latitudinaux. La génération de ces ensembles de données pour des périodes antérieures au XIXe siècle est cependant confrontée à un défi considérable, car il existe très peu de mesures directes de ces variables climatiques.
Nous nous appuyons sur des mesures indirectes du paléoclimat à l’aide d’indicateurs climatiques. Le plus abondant est le pollen fossile, c’est-à-dire le pollen produit par la végétation et qui peut être conservé pendant des milliers d’années dans des archives terrestres ou côtières (c.-à-d. les sédiments lacustres). Ce « proxy » est disponible sur tous les continents non couverts par les glaces à travers de nombreux régimes climatiques différents à travers le monde, et les données primaires sont de plus en plus accessibles par le biais de grandes bases de données relationnelles accessibles au public et gérées par la communauté. Notre capacité à utiliser ce proxy pour les reconstructions climatiques à l’échelle continentale, cependant, dépend de notre capacité d’analyser, d’explorer et de trouver des modèles dans ces bases de données riches et hétérogènes. En particulier, cela exige une bonne compréhension des incertitudes liées à la mesure indirecte du climat.
Dans la première partie de cette thèse, je présente trois nouveaux outils logiciels qui relèvent le défi de rendre accessible cette grande quantité de données et de construire et développer une base de données de pollen à l’échelle continentale. Ces outils couvrent un large éventail d’applications possibles pour tirer parti de notre travail avec des données proxy basées sur des sites à l’échelle continentale.
Le premier outil que je présente est une application Web qui s’articule autour d’un visualiseur de base de données interactif basé sur des cartes, développé principalement pour la base de données eurasienne moderne sur le pollen (EMPD, Eurasian Modern Pollen Database). Ce nouvel outil rend la base de données accessible à d’autres chercheurs et au grand public, et il permet un développement continu et stable. En plus des données de l’EMPD, je présente une extension de ce visualiseur qui rend accessible une vaste base de données sur les pollens fossiles de l’hémisphère Nord et permet son exploration visuelle.
Le deuxième outil s’attaque au défi de combler les lacunes dans certaines zones géographiques de la base de données de pollen. straditize est un logiciel de numérisation pour les diagrammes stratigraphiques, et les diagrammes de pollen en particulier. Il peut être utilisé pour générer de nouvelles données pour la base de données sur le pollen à partir de publications de l’ère pré-numérique, c’est-à-dire de publications dont les données primaires sur le pollen ne sont plus accessibles, mais dont la visualisation sous forme de diagramme de pollen est possible dans une publication.
Enfin, je présente le package python de visualisation générique psyplot, qui comble l’écart entre la visualisation, le calcul et la publication dans le travail quotidien des scientifiques, et qui a été utilisé dans plusieurs parties de la thèse. Ce logiciel flexible peut être intégré et amélioré par une variété d’applications et contient déjà de multiples méthodes de visualisation pratiques utiles pour la climatologie, en particulier la visualisation de données géo-référencées et il traite des données qui sont trop grandes pour tenir en mémoire ou qui vivent sur différentes grilles, structurées ou non.
La deuxième partie de ma thèse contient deux nouvelles méthodes statistiques pour estimer les environnements paléo-climatiques à grande échelle basées sur les relations modernes. La première, pyleogrid, utilise une grande base de données de pollen et la transforme en une reconstruction climatique maillée qui peut couvrir des échelles continentales, hémisphériques ou même globales. Ce logiciel se concentre sur l’intégration des incertitudes intrinsèques des données proxy. Le résultat de cette méthode de maillage permet de comparer des modèles climatiques computationnels avec une base de données d’observation indépendante qui fournit des estimations fiables de l’incertitude.
Le dernier chapitre de cette thèse applique une stratégie inverse et utilise les relations statistiques des variables climatiques modernes pour informer un modèle. Le générateur météorologique global (GWGEN, Global Weather Generator) a été paramétré avec des données provenant de milliers de stations météorologiques mondiales et fournit un outil qui permet de passer de l’échelle mensuelle à l’échelle quotidienne (« downscaling ») pour le monde entier. Cet outil peut être intégré dans un modèle global de paléo-végétation où il simule efficacement la météorologie quotidienne nécessaire.