Avec des collègues de l’EPFL, de l’Université de Zurich et du C2DH, Raphaëlle Ruppen Coutaz (Section d’histoire, UNIL) obtient un financement pour un projet Sinergia consacré à l’enrichissement de corpus d’archives de presse et de radio pour permettre de nouvelles formes d’explorations de ces corpus.
Projet
Contexte
Rendant compte du monde au quotidien, les archives de presse et de radio sont des sources inestimables pour l’étude des sociétés passées, ainsi que du fonctionnement et de l’évolution des écosystèmes médiatiques. Si la numérisation a grandement facilité l’accès à ces sources et ouvert la voie au traitement automatique de leur contenu, les collections numérisées restent souvent confinées à leurs institutions et pays d’origine, et les approches informatiques pour le traitement automatique de leurs contenus sont généralement limitées à une langue et à un type de média.
Objectifs
Ce projet a pour ambition de dépasser les frontières linguistiques et médiatiques et de permettre, pour la première fois, l’exploration conjointe du contenu d’archives de presse et de radio à travers le temps, les langues et les frontières nationales. L’objectif n’est pas simplement de juxtaposer des collections, mais de les enrichir et de les connecter à travers de multiples enrichissements sémantiques et de concevoir des capacités d’exploration appropriées pour les historien·ne·s, les universitaires et le grand public. Ces réalisations pionnières seront guidées par des recherches historiques originales sur les écosystèmes médiatiques avec, comme fil rouge thématique, le prisme de l’influence.
Sur la base d’un corpus d’archives de presse et de radio, une équipe composée d’historien·ne·s, de linguistes informaticien·ne·s, d’informaticien·ne·s, de spécialistes en humanités numériques et de designers travaillera à
- développer des techniques avancées pour l’enrichissement sémantique de textes historiques multilingues et leur représentation en un espace vectoriel unique ;
- proposer de nouvelles méthodes numériques pour la recherche en histoire ;
- et concevoir et implémenter des interfaces innovantes pour explorer, visualiser et comparer des sources médiatiques.
Impact scientifique et sociétal
Au-delà de la constitution d’un corpus inédit et du développement d’un cadre méthodologique et technologique de référence pour l’exploration de sources médiatiques multilingues sémantiquement connectées, ce projet ouvrira la voie à des recherches historiques transnationales et transmédia à large échelle, auparavant impossibles à mener. Impresso posera également les bases techniques et le savoir-faire nécessaire pour l’intégration – au niveau de leur contenu – d’archives variées et créera un précédent pour de futures réalisations intégrant d’autres types de sources, modalités et langues.
Direction du projet
- Raphaëlle Ruppen Coutaz, maître d’enseignement et de recherche, Section d’histoire Université de Lausanne, Suisse
- Maud Ehrmann, Research Scientist and Lecturer, Laboratoire d’humanités digitales, CDH, EPFL, Suisse
- Simon Clematide, Senior Researcher, Institut für Computerlinguistik, Universität Zürich, Suisse
- Marten Düring, professeur assistant, Université du Luxembourg, Luxembourg Centre for Contemporary and Digital History (C2DH), Luxembourg
Équipe du projet
- Ferdaous Affan (C2DH)
- Michail Andrianos (UZH)
- Kaspar Beelen (C2DH)
- Emanuela Boros (EPFL)
- Estelle Bunout (C2DH)
- Pauline Conti (EPFL)
- Martin Grandjean (UNIL)
- Daniele Guido (C2DH)
- Arthur Michelet (UNIL)
- Kartikey Sharma (EPFL)
- Lars Wieneke (C2DH)
Durée du projet
- 2023-2027