Thèse soutenue par Michael LEUENBERGER, le 19 janvier 2018, Institut des dynamiques de la surface terrestre (IDYST)
En raison de la grande quantité et de la complexité des données disponibles de nos jours dans les domaines des géosciences et des sciences de l’environnement, nous sommes confïontés à la nécessité de développer et d’intégrer des méthodes plus robustes et efficaces pour analyser, modéliser et visualiser ces données.
Une partie importante de ces développements passe par l’élaboration et la mise en application de méthodologies cohérentes qui doivent prendre en compte l’ensemble du processus de modélisation (de la récolte des données jusqu’à la justification des résultats). Les progrès fondamentaux ayant récemment eu lieu dans le domaine des apprentissages automatiques (machine learning) contribuent à l’émergence du domaine appelé environmental data science.
Le principal objectif de cette thèse est essentiellement basé sur le développement de méthodologies cohérentes utilisant les algorithmes d’apprentissage automatiques pour l’analyse des phénomènes environnementaux. En particulier, cette thèse fournit une vue d’ensemble des algorithmes d’apprentissage automatique pour les tâches d’extraction d’informations contenues dans les données récoltées.
Elle met en évidence et examine les différents problèmes qui surviennent lors de l’application de telles méthodes sur des données qui peuvent être complexes et contenir un nombre important d’informations. Dans cette optique, plusieurs sujets majeurs en relation avec les algorithmes d’apprentissage automatique sont discutés, tels que l’analyse de la complexité, l’évaluation des erreurs et la quantification des incertitudes des modèles générés.
De plus, une attention toute particulière est faite au modèle appelé Extreme Learning Machine (ELM). Cet algorithme basé sur les réseaux de neurones artificiels permet des résultats rapides et précis pour la modélisation de phénomènes environnementaux.
Ainsi, une partie de cette thèse a pour objectif d’intégrer et d’exploiter au maximum les différentes facultés de cet algorithme dans le but d’apporter une compréhension détaillée du phénomène étudié. A cet égard, le thème principal de cette thèse est axé sur le développement de méthodologies cohérentes pour l’analyse de phénomènes environnementaux avec l’aide des algorithmes d’apprentissage automatique. Une mise en application des méthodologies et méthodes développées dans cette recherche a été réalisée sur des données simulées ainsi que sur des données réelles de phénomènes tels que les feux de forêts, la pollution et les champs du vent.