Des ressources de stockage et de calcul pour les chercheurs de l’UNIL

par Serge Paschoud, responsable gestion, et Hamid Hussain-Khan, CTO, Ci-UNIL

Le premier cluster de calcul haute performance (HPC) du Centre informatique ainsi que l’application dédiée aux demandes sont opérationnels pour les chercheurs.

© Visual Generation | Dreamstime.com

Le calcul haute performance (HPC) sur un nouveau cluster a démarré à la division calcul et soutien à la recherche (DCSR), et ce n’est qu’un début

Qu’est-ce qui a été mis en place ?
Historiquement, les facultés ont financé diverses infrastructures de calcul locales. Ces infrastructures sont relativement hétéroclites par leur taille et leur âge. De plus, elles offrent des services à un nombre relativement restreint de chercheurs. D’un point de vue global, ce système est coûteux et inefficace. Le but est donc de centraliser l’infrastructure pour offrir un meilleur service à l’ensemble de la communauté. Pour cette raison, la DCSR a mis en place un nouveau serveur de calcul, nommé Wally pour les intimes. Ce cluster a été assemblé en regroupant d’une manière centralisée un maximum de machines préexistantes. Elle répond ainsi aux besoins de l’ensemble de la communauté et à l’organisation interne de l’UNIL. Les premiers calculs ont été réalisés fin mai.

Comment faire sa demande ?
Le service de calcul est accessible à partir du catalogue de services du Ci, catégorie recherche. Une application développée par le Ci permet de demander les espaces de stockage nécessaires et d’ouvrir les accès au service de calcul.

Le Ci a développé une application web pour gérer efficacement les demandes de ressources de recherche.

Combien cela va-t-il me coûter ?
Les coûts sont calculés chaque année selon les règles du Fonds National Suisse (FNS). Approximativement 30% des coûts réels sont à la charge du PI (Principal Investigator), ce qui correspond au coût direct éligible à un remboursement par le FNS et certains fonds européens. Les 70% restants sont pris en charge par l’UNIL.

N’oubliez pas de demander un budget pour la partie informatique de vos projets lors de demandes de fonds.
Ce budget vous permettra de vous faire rembourser les factures du centre de calcul. Vous n’aurez ainsi pas besoin de trouver d’autres sources de financement pour payer les factures liées au calcul et au stockage.

Pourquoi doit-on payer ?

  • Pour financer l’infrastructure de manière régulière et non par des achats ponctuels importants et parfois difficiles à financer par les groupes de recherche.
  • C’est une manière pour l’UNIL d’obtenir des fonds complémentaires pour ses infrastructures par un remboursement du FNS ou d’autres bailleurs de fonds.
  • L’explosion des données de recherche nécessite une optimisation des ressources. Une facturation de la partie remboursable par le FNS est un outil incitatif à une gestion optimisée par les chercheurs.
  • Par souci d’équité. Une minorité de groupes de recherche utilisent fortement ces infrastructures tandis que la plupart ont une utilisation modérée à faible.

Comment ce service va-t-il évoluer ?
Le déploiement d’un cluster de calcul dédié aux données sensibles est prévu en 2020.

Le stockage de données de recherche se réorganise

Qu’est-ce qui a été mis en place ?
Une infrastructure de stockage moins coûteuse pour l’ensemble des données de recherche de l’UNIL. En parallèle, l’organisation de ces données a été repensée dans l’optique de gérer le cycle de vie et l’augmentation exponentielle des données de recherche. De plus, cela doit permettre un remboursement du stockage de ces données par le FNS aux chercheurs en ayant fait la demande.
La directive 4.5 détaille l’ensemble des nouvelles règles, dont les principales sont :

  • le stockage des données de recherche n’est plus gratuit, mais subventionné
  • les données de recherche et administratives sont séparées
  • les données de recherche sont gérées par projet avec un cycle de vie complet explicité dans un plan de gestion de données, ou data management plan (DMP).

Comment obtenir un espace de stockage ?
L’application pour faire une demande est accessible dans le catalogue de service du Ci et pointe sur la même application que pour le calcul. Durant le processus, les éléments requis (DMP, type de service etc.) sont clairement demandés.

Le Ci va offrir un service de stockage des données sensibles. © Funtap P | Dreamstime.com

Quels types de stockage proposez-vous ?
Pour les données de recherche, nous proposons deux niveaux de service

  • 2 copies : recommandé pour les données primaires. Ces 2 copies sont sur 2 systèmes distincts et dans 2 lieux différents. Cela couvre les risques liés à un lieu et ceux liés à un bug du système d’exploitation.
  • 1 copie : recommandé pour les données secondaires facilement reproduites depuis les données primaires ou pour les données primaires dont une copie est présente hors UNIL (GenBank, NIH, etc…).

Comment ce service va-t-il évoluer ?
Premièrement l’intégration d’une fonctionnalité « Data management plan » (DMP) plus complète dans l’application de demande de service, ce qui permettra une meilleure gestion des données.
Deuxièmement, un service de stockage sécurisé dédié au stockage des données sensibles sera mis en place.

La digitalisation des demandes de service et l’automatisation des processus est déjà visible

Où trouve-t-on le PDF à signer et à renvoyer pour ces services ?
Nulle part heureusement ! L’application mentionnée ci-dessus permet faire les demandes de services, ce qui était la fonctionnalité minimale requise pour sa mise en production. L’automatisation du back-office est en cours.

Ce qu’il faut savoir sur l’application

  • Seul un PI peut faire une demande.
  • Le stockage, le calcul et la facturation sont organisés par projet pour permettre un remboursement par le FNS ou certains bailleurs de fonds européens si un budget avait été accordé.
  • Les données sensibles et personnelles doivent être annoncées.
  • Une page vous permet de sélectionner les ressources de stockage ou de calcul désirées. Un service de stockage ou de calcul standard est proposé, mais vous pouvez affiner la sélection sous l’onglet « Sélection Avancée ».

IMPORTANT : Lors de votre demande d’espace, assurez-vous bien que la sécurité de vos données soit assurée en sélectionnant le bon niveau de service pour leur stockage.

Comment ce service va-t-il évoluer ?
Actuellement, 2 fonctionnalités semblent prioritaires à développer :

  • L’intégration, la consultation et la modification d’un DMP pour chaque projet.
  • Une interface de consultation pour visualiser la quantité de ressources consommée par projet (ou par PI) afin de permettre à l’utilisateur d’avoir une bonne visibilité sur sa consommation et les coûts qu’elle engendre.

Liens utiles