Le FNS exige désormais un plan de gestion des données pour accorder ses fonds

par Hamid Hussain-Khan, informatique scientifique, Ci-UNIL

Dès le mois d’octobre 2017, le FNS conditionnera l’octroi de fonds de recherches au dépôt d’un plan de gestion des données.

© JumalaSika ltd – Fotolia

Les exigences du plan de gestion des données

A l’instar d’autres programmes de financement de la recherche, tel que Horizon 2020 et l’European Research Council au niveau européen ou le National Science Foundation aux Etats Unis, le FNS a décidé de rendre obligatoire l’adjonction d’un plan de gestion des données en annexe au dépôt d’une demande de fonds de recherche. Cette obligation sera effective à partir d’octobre 2017. Les manquements seront sanctionnés par l’impossibilité d’obtenir des fonds de recherches pour cause de dossier incomplet.

« Archivage » sans Data Management Plan ni métadonnées.
© mickyso – Fotolia

Un plan de gestion des données, plus communément désigné sous l’acronyme DMP (Data Management Plan) est un document décrivant toutes les étapes du cycle de vie des données produites au cours d’un projet de recherche. Cela implique une réflexion préalable sur toute une série de questions relatives aux données que l’on va utiliser ou produire dans le cadre d’un projet de recherche.

Le document peut prendre diverses formes et couvrir avec plus ou moins de détails les différentes étapes du cycle de vie des données. Le FNS a décidé de mettre en ligne dans son portail MySNF un formulaire concernant le DMP. Les questions auxquelles les chercheurs devront répondre sont au nombre de douze et sont réparties en quatre thèmes :

  • la collecte des données et leur documentation
  • les questions éthiques, légales et de sécurité
  • le stockage et la préservation des données
  • le partage et la réutilisation des données.

Le détail des questions et leur cadre d’interprétation sont décrits dans le document en ligne : « Data Management Plan – contenu du formulaire mySNF »

Il est certain que les chercheurs ne pourront pas répondre de manière précise et exhaustive à chacune de ces questions avant même que leur projet de recherche n’ait débuté. Cette situation est parfaitement attendue et le DMP est un document vivant qui est appelé à évoluer au cours du projet de recherche. À la clôture du projet, la version finale et complète du DMP sera rendue publique dans la base de données P3 du FNS.

Nos collègues d’UNIRIS, le service des ressources informationnelles et archives de l’UNIL, proposent sur un site Web dédié toute une série d’informations concernant les bonnes pratiques pour la réalisation d’un DMP :

Ils organisent aussi une permanence tous les mercredis matin des mois d’août et de septembre en vue de répondre aux questions des chercheurs de l’UNIL concernant la rédaction de leur DMP.

L’implication du Ci

Le Centre informatique de l’UNIL peut être impliqué dans la réponse apportée à la question 3.1 : « De quelle manière vos données seront-elles stockées et sauvegardées au cours de la recherche ? » Le FNS préconise l’utilisation de ressources de stockage centralisées et opérées par un centre informatique.

Les données de recherches stockées sur les desktops ou laptops des chercheurs (à l’exception des bases de données) peuvent être sécurisées au Ci jusqu’à concurrence d’un volume de 100 GB par le logiciel de sauvegarde CrashPlan. La fréquence par défaut des sauvegardes automatiques est de quatre par heure. La rétention est d’une version par heure durant la dernière semaine, puis une version par jour pendant les 90 derniers jours. Les fichiers effacés de la machine source disparaissent des sauvegardes après 90 jours. Ce service du Ci est gratuit pour le personnel UNIL.

Les machines hébergeant des bases de données ou les serveurs hébergeant jusqu’à quelques centaines de GB de données et au maximum 1 TB sont protégées par logiciel de sauvegarde Networker. La sauvegarde est quotidienne et les périodes de rétentions sont de 90 jours pour les fichiers et de 30 jours pour les bases de données. Ce service du Ci est gratuit.

Archivage avec Data Management Plan et métadonnées
@ kk_images – Fotolia

Les volumes de données plus conséquents peuvent être stockés sur le NAS Isilon (Network Attached Storage) de l’UNIL. Les données sont snapshotées deux fois par jours et les snapshots sont conservés pendant 90 jours. Un snapshot est un état consistant des données figées à un moment défini dans le temps et accessible en lecture seule. Les données sont aussi répliquées toutes les quatre heures sur un deuxième NAS Isilon hébergé dans un autre bâtiment sur le campus de l’UNIL. Pour certaines données particulièrement précieuses, il est possible d’effectuer une troisième réplication mensuelle des données. Cette réplication utilise des technologies indépendantes à tous niveaux par rapport à celles utilisées sur les deux premières plateformes de stockage. Les données sont hébergées sur un troisième site indépendant des deux premiers.

Les deux premières copies ne peuvent être dissociées l’une de l’autre. La troisième est optionnelle.

La main à la poche

Jusqu’à présent, le service de stockage sur le NAS Isilon était gratuit. Toutefois, il est probable qu’à plus ou moins court terme cela ne puisse plus être le cas. La croissance actuelle de la demande en volume de stockage est telle que le Ci ne peut plus financer seul sur son budget actuel les besoins futurs des chercheurs.

Les chercheurs de l’UNIL devront ajouter une rubrique « stockage » dans leurs demandes de budget au FNS.
© leszekglasner – Fotolia

Nous recommandons aux chercheurs d’inclure dans leurs demandes de fonds des subsides pour leurs besoins en service de stockage (et éventuellement de calcul). Le FNS offre cette possibilité depuis environ deux ans. Le Ci est en négociation avec le FNS pour faire valider son modèle de coûts pour l’utilisation de services de stockage. Ces derniers seront considérés en tant qu’infrastructure selon l’article 28 paragraphe 2 lettre d du « Règlement des Subsides » du FNS.

En 2017 nous préconisons de budgétiser un coût de 250 CHF par TB et par année pour chacune des deux premières copies sur les NAS Isilon (soit 500 CHF) et 250 CHF de plus par TB et par année si une 3e copie des données est nécessaire. Ces prix sont comparables aux coûts d’hébergement de données sur les infrastructures de stockages de Vital-IT. Ces derniers disposent d’ores et déjà d’un modèle de coûts validés auprès du FNS à 215 CHF par TB et année. Les prix seront revus annuellement selon l’évolution du coût des infrastructures de stockage.