La maîtrise des données de recherche, c’est un métier

bagnoudguirlet 90
Gérard Bagnoud, directeur des Ressources Informationnelles et archiveS (UNIRIS). Marielle Guirlet, collaboratrice à UNIRIS. Photo Nicole Chuard © Unil

Les chercheuses et les chercheurs produisent de plus en plus de données. Leur gestion demande du temps et des compétences dans plusieurs domaines, du droit à l’informatique en passant par l’éthique. Ce qui fut une activité annexe se mue en un travail de professionnel. Plusieurs institutions suisses se sont justement associées pour proposer une formation au métier émergent de «Data steward».

Il existe au moins un point commun entre les séquençages d’ADN réalisés par des biologistes, les enquêtes menées auprès de la population par des sociologues et les relevés sur les chantiers de fouilles établis par des archéologues: la production de données. Dans le domaine de la recherche, ces dernières sont de plus en plus nombreuses avec les années.

Ainsi, à l’Unil en 2026, 2 pétabytes de données devraient être produits par les scientifiques, soit 2000 térabytes. Cela permettrait de remplir la mémoire d’au moins 15 millions de smartphones situés dans le milieu de gamme. En 2023, ce volume était moitié moindre. Les institutions doivent donc fournir de plus en plus d’espace de stockage, ce qui a un coût.

Même si elle n’est pas simple à gérer, cette montagne de 1 et de 0 ne représente que l’aspect quantitatif de la question. Les bailleurs de fonds exigent bien souvent, de la part des scientifiques, l’établissement de «plans de gestion des données» avant de débuter un projet de recherche. Cela implique d’organiser le cycle de vie des données, leur création, leur structuration et leur archivage, en passant par les conditions de leur réutilisation. Des questions éthiques, juridiques et de protection des données doivent être traitées (par exemple, si la recherche contient des données à caractère personnel).

La politique montre aussi le bout de son nez, quand des chercheuses et chercheurs de plusieurs institutions collaborent de manière internationale, mais que les autorités du pays qui héberge les informations se montrent de plus en plus restrictives quant à leur accessibilité.

On ne peut plus tout faire

Ces contraintes ont pour conséquence que «l’idée du scientifique qui sait tout faire, de l’enseignement à la recherche en passant par le management d’équipe, en plus de la gestion de ses données, s’avère de plus en plus déconnectée de la réalité», remarque Georg Lutz, directeur de FORS (Centre de compétences en sciences sociales, installé à l’Unil). Ce professeur est également directeur académique d’une formation conçue pour répondre au besoin de professionnalisation de la gestion des données de recherche. Il s’agit d’un Certificate of Advanced Studies (CAS) en Research Data Stewardship, dont la deuxième édition débutera en avril 2026.

Ce cursus répond à un besoin «identifié lors de deux enquêtes menées en interne à l’Unil, précise Gérard Bagnoud, directeur des Ressources Informationnelles et archiveS (UNIRIS) et membre du Comité scientifique du CAS. Un réseau de data stewards a déjà été mis en place pour y répondre.» Ces postes ont attiré des personnes qui souhaitaient orienter leur carrière académique vers un métier émergent, mais pour lequel manquait encore une formation certifiante en Suisse. Auparavant, la gestion des données s’apprenait «sur le tas».

Tous les domaines de recherche sont concernés. Ainsi, le CAS est proposé conjointement avec les universités de Genève et de Zurich, la HEP-Vaud, la Haute école de gestion de Genève et la Zürcher Hochschule für Angewandte Wissenschaften, FORS et SIB. Cette collaboration s’est faite dans le cadre du projet «Swiss Data Stewardship Environment: Profile – Training – Network» co-financé par swissuniversities et dirigé par l’Unil.

georglutz 90
Georg Lutz, professeur et directeur de FORS (Centre de compétences en sciences sociales). Photo Nicole Chuard © Unil

Soutien à la recherche

L’une des missions des data stewards consiste à accompagner les chercheuses et les chercheurs, dès le doctorat déjà. «Il est intéressant de leur apporter les outils, la culture et les bonnes pratiques dès le début de leur carrière académique, note Marielle Guirlet», coordinatrice du CAS et collaboratrice à UNIRIS. Projet délimité, une thèse est le cadre idéal pour l’apprentissage de la bonne gestion des données. Il est important de «partir juste», et c’est justement là que les spécialistes formés dans le cadre du CAS peuvent intervenir avec profit.

Ces derniers «soulagent les scientifiques des questions éthiques, juridiques ou techniques liées aux données, ce qui leur permet de se consacrer à leur métier, soit la recherche et la publication d’articles dans des revues spécialisées», ajoute Georg Lutz.

À un niveau plus large, comme celui des institutions, les data stewards devraient «contribuer à réaliser les principes internationaux FAIR, un acronyme qui résume l’idée que les données et les ressources numériques produites soient faciles à trouver, accessibles, interopérables et réutilisables», explique Gérard Bagnoud. Le partage et la réutilisation, à l’international, des informations issues de travaux de recherches constituent l’un des socles de la science contemporaine.

Ouverture et fermeture

Cela touche au mouvement de la «science ouverte», qui tend vers l’idée que les données et la production scientifique en général, issues des institutions de recherche, doivent être accessibles à tous. Cet objectif comporte quelques limites éthiques (confidentialité), économiques et politiques (secrets industriels et intérêt national) et légales (protection de données personnelles, en médecine humaine par exemple) auxquelles les data stewards peuvent sensibiliser les chercheuses et les chercheurs. Leur rôle consiste justement à s’intéresser aux développements de ce domaine.

Le suivi de l’actualité tout court figure parmi leurs tâches. En ce moment, les institutions européennes s’inquiètent du sort de bases de données scientifiques supprimées de serveurs publics américains par l’administration Trump. Les «études genre» et la recherche sur le climat figurent parmi les cibles de choix. La question du lieu de stockage des informations, en lien avec leur mise à disposition, se pose de manière soudaine dans ce cas.

L’archivage est également à prendre en compte. D’un côté, pour des raisons de coûts, il n’est pas possible de garder l’ensemble des données produites par chaque scientifique, pour l’éternité. De l’autre, des informations collectées par le passé peuvent «avoir une utilité secondaire inattendue, relève Gérard Bagnoud. Par exemple, l’étude d’anciens menus de restaurants de la côte Est des États-Unis nous renseigne sur les populations de homards de l’époque!» Que garder, que jeter? Là aussi, les data stewards peuvent apporter leur expertise.

Trois orientations

Sur le plan formel, le CAS offre 12 crédits ECTS et est dispensé en anglais. Il est composé d’un tronc commun de trois modules, et d’un «module d’orientation». Les branches de ce dernier sont «transdisciplinaire», «biologie et médecine» ainsi que «sciences humaines et sociales», au choix des participantes et participants. Selon les domaines en effet, «les traditions de recherche varient, indique Georg Lutz. Cette offre de spécialisation permet une adaptation à des contextes différents. De plus, cela constitue un élément d’acceptation. Il sera par exemple plus naturel pour des biologistes de traiter avec des data stewards qui connaissent leur univers.»

La première volée du CAS a terminé son cursus en été 2025. «Dans leurs retours, en cours d’analyse, les participantes et les participants mettent en avant la richesse du partage de leurs expériences professionnelles, dans des cultures scientifiques différentes», remarque Marielle Guirlet. Le cursus colle aux besoins, puisque l’une des personnes formées, un chercheur qui a réorienté sa carrière, a justement trouvé un poste de data steward grâce au CAS. Un nouveau métier fait sa place dans le monde académique.

Laisser un commentaire