Des sites web à la perception de la santé publique dans diverses régions du monde

Céline Rozenblat, Institut de géographie et durabilité (IGD)

Céline Rozenblat est géographe spécialiste des systèmes complexes. Ses recherches portent principalement sur les villes et les différents réseaux qui supportent leur fonctionnement.

Son objectif est de pouvoir modéliser leurs multiples dimensions – urbaines, économiques, sociales ou environnementales – afin de comprendre leurs interactions et identifier les moteurs d’évolution de la cité.

Céline Rozenblat a utilisé l’IA pour la première fois dans un mandat réalisé en collaboration avec l’Organisation Mondiale de la Santé. L’objectif de cette étude était d’identifier quelles actions publiques ou privées répondaient ou non à des enjeux de santé urbaine dans différentes régions du monde, et comment ces enjeux et ces actions étaient ou non liées aux questions de développement durable.

Des millions de publications et de sites web d’institutions ont été analysés, afin d’en extraire le contenu et classifier les termes apparaissant ensemble. Plutôt que d’effectuer une classification standard, les scientifiques ont utilisé une modélisation thématique1 (Topic Modelling), pour identifier des associations de mots pertinentes. L’un des résultats obtenus montre que les actions sont davantage cloisonnées (les questions de santé demeurant très distinctes des questions de durabilité) là où les institutions existent depuis longtemps (comme en Europe et en Amérique du nord). Selon Céline Rozenblat, « Les résultats de cette approche ont mis en lumière des relations plus claires, plus épurées (avec moins de paramètres) et plus robustes, qu’avec les modèles standards de classifications ».

Les villes changent de forme ou grandissent – mais pourquoi ?

Actuellement, Jingyan Yu, post-doctorante du groupe de Céline Rozenblat, étudie l’évolution de l’étalement des villes du monde au cours du temps. Initialement uniquement axée sur l’analyse d’images satellites (différences de contenu des pixels – ville versus non-ville), ses modèles intègrent l’IA pour qualifier les changements observés, et tentent désormais d’inclure des modèles liés au fonctionnement urbain, afin de comprendre quels paramètres influencent le plus l’accroissement ou le changement de forme de la ville.

Mêler boîte noire et boîte blanche pour pouvoir travailler dans une zone grise

Céline Rozenblat reste pragmatique quant à l’utilisation de l’IA. Elle reconnaît ses atouts avec des outils puissants, tels que Chat GPT, qui facilitent la communication et le traitement de l’information. Selon elle, les modèles intégrant l’IA ne doivent cependant pas remplacer les modèles classiques « explicatifs », mais les compléter. Le machine learning a ses limites, car il fonctionne souvent sur des moyennes ne générant pas de résultat innovant (voir aussi l’encadré). De plus, il existe un effet « boîte noire » entre les données d’entrée et les résultats de sortie, qui ne permet pas toujours de comprendre comment on en est arrivé au résultat. Selon Céline Rozenblat « il est pertinent de pouvoir avoir une combinaison des deux approches : utilisation de l’IA sur les données (boîte noire) couplée à un modèle connu et maîtrisé (boîte blanche) pour pouvoir travailler dans une boîte grise ».

L’une des utilisations prometteuses de l’IA selon elle, est son rôle potentiel dans le soutien des régions en voie de développement. Par exemple l’augmentation et la systémisation de l’analyse des images satellites grâce à l’IA peut aider à la gestion du territoire, de régions dans lesquelles les ressources pour effectuer des mesures de terrain ou échanger des données sont limitées.

MOOC Healthy urban Systems

Selon Céline Rozenblat, l’impact de l’IA dépend de la manière dont elle est utilisée. On peut l’appliquer comme une recette de cuisine, ce qui ne génère pas de nouvelle connaissance. Mais on peut aussi l’utiliser pour aller au-delà des principes connus. Elle mentionne notamment l’approche qui consiste à trouver des équations à partir de l’analyse de milliers de données (processus connu sous le nom de « machine scientists »). Ici l’objectif est de laisser l’IA tester de multiples équations au sein des données pour en extraire les plus favorables (celles qui expriment le mieux les relations entre ces données). L’IA est indispensable car elle combine des milliers de types d’équations qu’il serait impossible de tester avec des modèles standards. Il est ensuite possible de sélectionner l’équation la plus pertinente par rapport au modèle théorique ou de confronter différentes équations pour obtenir des débats enrichissants. Céline Rozenblat décrit ce processus dans un MOOC sur l’approche systémique de la santé urbaine (Healthy Urban Systems) comportant plusieurs chapitres consacrés à l’IA.


  1. La modélisation thématique utilise le machine learning pour identifier des structures de textes ou groupes de mots similaires au sein d’un corps de texte.  ↩︎

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *