Data Analysis Using Network, Multifractal and Dimensionality Reduction Tools

Thèse soutenue par Mohamed Laib, le 3 mai 2019, Institut des dynamiques de la surface terrestre (IDYST)

Les récentes avancées dans la technologie de collecte et de stockage des données ont permis d’améliorer les systèmes de surveillance météorologique. Ainsi, il est possible d’enregistrer les paramètres météorologiques et climatiques à une fréquence plus élevée et d’utiliser un certain nombre de capteurs répartis spatialement dans plusieurs endroits différents. Par conséquent, l’exploration, la modélisation et la compréhension de ces paramètres environnementaux nécessitent la recherche de nouvelles techniques plus efficaces.

Cette thèse est composée d’articles publiés qui se basent sur les données du vent en Suisse. Elle propose des approches d’exploration et de modélisation de données environnementales multivariées. Les contributions majeures de cette thèse sont :

  • Une nouvelle approche qui se base sur les réseaux. Plus précisément, chaque station de vent est considérée comme un nœud. Le lien entre deux nœuds est exprimé par la relation qui existe entre les deux stations correspondantes. Cette approche étudie l’évolution journalière de l’interaction (la densité de connectivité) entre les stations, avec des outils d’analyse de séries temporelles.
  • L’application d’une méthode de détection de communauté sur le réseau du vent. Cette application permet de grouper les stations selon les interactions entre elles.
  • L’analyse des séries temporelles en utilisant le concept de multifractale. Cette analyse permet d’extraire des informations à partir de chaque série du vent comme la mémoire longue par exemple. Puis, une visualisation spatiale est réalisée, afin de voir spatialement la prédictibilité temporelle du vent selon la topographie.
  • Un nouvel algorithme permettant de réduire le nombre de variables. En effet, l’algorithme détecte les variables redondantes et les élimine. Cet algorithme est utilisé pour réduire la dimension des jeux de données ce qui facilite l’analyse du phénomène.
  • De nouvelles librairies R publiées en libre accès, dans lesquelles les méthodes mentionnées plus haut sont implémentées. Ces librairies sont accompagnées de manuel d’utilisation.

Cette thèse a pour but d’analyser les données multivariées. Elle propose des techniques basées sur les réseaux pour extraire le plus d’informations possibles afin de bien explorer ces données. Elle propose également une visualisation spatiale des caractéristiques temporelles des données. La thèse contribue à la littérature du ‘Machine Learning’ avec le nouvel algorithme de sélection de variables.

Finalement, la thèse cherche à améliorer la compréhension du mécanisme qui influence le phénomène du vent. De plus, les méthodes et l’algorithme proposés peuvent aussi être appliqués à d’autres phénomènes géospatiaux.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *