Des crédits conjoncturels pour stocker toujours plus

par Serge Paschoud, responsable gestion, Ci-UNIL

L’UNIL a reçu différents crédits conjoncturels en 2018 pour développer le stockage et la sécurisation de données récoltées, traitées et stockées dont le volume augmente constamment à l’UNIL.

© Pavlo Vinnyk | Dreamstime.com

Le défi du stockage et de la sauvegarde des données à l’UNIL

On dit que la donnée est le bien le plus précieux des entreprises et qu’il faut l’exploiter intelligemment pour que les entreprises puissent croître, se diversifier ou créer de nouveaux business models.

Toutefois, la croissance est telle qu’il n’est pas certain que tout puisse être conservé. Une raison importante est le coût du stockage, mais également la capacité de stockage qui pourrait ne pas suffire au vu de l’augmentation exponentielle de la quantité de données, surtout des données non structurées.

Augmentation mondiale de la quantité de données structurées (bases de données) et non structurées (fichiers), l’UNIL suit la même tendance – IDC, 2011, Digital Universe Study

Les données structurées (tirées de bases de données) de l’UNIL représentent environ 90 TB avec une croissance linéaire estimée entre 4 et 6% par an. Il s’agit des données essentielles pour l’UNIL provenant de SAP (ERP gérant finances, ressources humaines, …), dans Exchange (messagerie) ou dans Sylvia (intranet administratif) par exemple. Un crédit conjoncturel de 400’000.- CHF a été attribué pour mettre en place une nouvelle solution moderne pour leurs sauvegardes.

Les données non structurées (des fichiers de toutes sortes) hébergées au Ci représentent environ 1100 TB (=1.1PB) avec une croissance exponentielle d’environ 30% pour 2018. Ce volume important ne représente pourtant que le 20% des données de ce type stockées à l’UNIL, la plus grande part étant hébergée par Vital-IT (60%) et les NAS Synology des facultés (20%). Ce sont donc les données de recherche qui sont en forte augmentation, principalement générées par des appareils scientifiques, ainsi que des fichiers issus de l’enseignement ou de l’administration. Les données de recherche concentrent par conséquent plus de la moitié des ressources conjoncturelles attribuées au Ci cette année.

Un service pour les données de recherche

Actuellement, toutes les données non structurées, qu’elles soient de recherche ou non, sont stockées dans un NAS Isilon répliqué hébergé au Ci. Avec l’augmentation des données de recherche et les nouvelles règles les concernant, il devient nécessaire d’instaurer un nouveau service avec ses règles propres dédié aux données de recherche. Dans ce but, un crédit conjoncturel de 350’000.- CHF a été attribué au Ci pour la mise en place d’un service à petite échelle dans un premier temps, mais qui est appelé à croître (très) rapidement.

Les nouveaux projets de recherche devront stocker dès 2019 leurs données dans ce service avec les nouvelles règles de gestion qui seront édictées par la Direction tandis que les données de recherche existantes devront migrer de l’infrastructure actuelle vers la nouvelle. Cette migration est une opération longue et une période de transition est prévue. Les utilisateurs de l’infrastructure actuelle seront contactés lorsque leurs données seront concernées. A terme, la nouvelle infrastructure se veut moins onéreuse et capable de croître jusqu’à plusieurs dizaines de PB.

A noter que l’infrastructure existante contenant tout type de données bénéficie également d’un crédit conjoncturel de 500’000.- CHF pour augmenter son espace afin d’assurer un espace de stockage suffisant pour cette année. Sans les données de recherche, cette infrastructure devrait ensuite croître de façon modérée.

Le cas des données sensibles

Bien que les données sensibles doivent être sécurisées depuis longtemps, les scandales récents et une nouvelle législation européenne entraînent une attention accrue à leur protection, qui doit être définie dès les demandes de fonds. Une infrastructure centrale dédiée et sécurisée est donc nécessaire pour que l’UNIL puisse continuer à bénéficier de fonds publics pour des projets récoltant, traitant ou simplement stockant des données sensibles. La sécurisation doit être physique et software (cryptage), mais aussi organisationnelle de manière à ce que seules les personnes autorisées puissent y avoir accès. Le Ci est donc à la recherche d’une solution lui permettant idéalement de confier les clés de cryptage aux chercheurs, afin de ne plus pouvoir lire les données sensibles qu’il héberge. Cela renforcera la confiance des chercheurs dans la solution tout en les responsabilisant, car le Ci ne sera pas en mesure de décrypter leurs données en cas de problème. Pour ce projet, le Ci a reçu un crédit conjoncturel de 250’000.- CHF, ce qui permettra de lancer une infrastructure de taille modeste, mais dont l’architecture doit permettre une croissance aisée.

Résumé des crédits conjoncturels (en CHF HT)

sauvegarde des données structurées 400’000.-
augmentation d’espace pour l’infrastructure existante 500’000.-
nouvelle infrastructure pour les données de recherche 350’000.-
nouvelle infrastructure pour les données sensibles 250’000.-