Héberger, sauvegarder ou stocker en réseau

interview de Christophe Marbacher, production & système, Ci-UNIL, par Patrice Fumasoli, rédacteur en chef

Le Ci propose à la communauté UNIL des solutions d’hébergement, de stockage et de sauvegarde centralisées. Tour d’horizon.

09_heberger
© Nejron Photo – Fotolia.com

Le Ci peut-il fournir machine virtuelle, sauvegarde de serveur ou espace disque réseau à toute la communauté UNIL ? Si oui, comment faire ma demande ?
Oui, à condition que la demande corresponde à un projet scientifique ou académique.
Rendez-vous sur le site du Ci pour remplir notre formulaire :

09_heberger_formulaires

La demande arrive ensuite dans OTRS, l’outil de ticketing du Ci. Cela permet au client de suivre l’état de sa demande et au Ci d’améliorer collaboration et traçabilité.

Quels délais attendre ?
Une petite semaine pour la première réponse. Un ingénieur prendra ensuite contact avec le demandeur pour régler les détails et établir le planning.

Y a-t-il des limites ?
Pour les demandes modestes aucun soucis, la ressource est en principe mise à disposition dans la semaine. Par contre, s’il s’agit d’une demande massive, il s’agira d’un projet à part entière à mener à bien en partenariat avec le Ci (financement, commande de matériel, …). Dans ce dernier cas, 2 à 3 mois de délai sont à prévoir.

Le Ci n’est pas un cloud où tout est automatisé, il faut toujours attendre une validation et un traitement humain. En cas de demande de machine virtuelle le Ci met la ressource à disposition, l’héberge, mais le demandeur gère la machine.

Le Ci ne fournit donc pas (encore) d’applications en mode SaaS, mais joue plutôt le rôle d’un hébergeur traditionnel.

Y a-t-il encore des serveurs physiques répartis sur le campus ?
Ma vision est limitée aux serveurs que nous sauvegardons, elle n’est donc pas exhaustive. Cela représente tout de même une petite centaine de machines. Mais la tendance est à la virtualisation, au Ci et dans les facultés (HEC a son VCenter, le CIG a son centre de calcul, …).

Les serveurs sont si fiables de nos jours… pourquoi encore se préoccuper de sauvegarde ?
Principalement en raison des utilisateurs ! L’erreur est humaine, il faut donc pouvoir restaurer les données qui sont toujours plus nombreuses et plus précieuses. La panne ou l’incendie sont également toujours des risques réels.

Quelles techniques utilise-t-on au Ci pour sécuriser les données ?
Le NAS (partage de fichiers, données non structurées) est sécurisé de 3 façons :

  • réplication asynchrone des données de la baie primaire sur la baie secondaire (2 sites géographiques distincts)
  • snapshots (soit une photo de l’ensemble des fichiers à un instant t utilisable si et seulement si les données primaires sont encore disponibles)
  • backup traditionnel (copie des données sur le DataDomain grâce à un logiciel résident, Networker en l’occurrence).

Mais vu les volumes actuels qui atteignent l’échelle du Péta, il n’est plus possible de tout sauvegarder chaque jour ! Il faut actuellement 2 semaines pour faire une sauvegarde intégrale du NAS. Le snapshot est donc un procédé qui s’impose de lui-même.

Le SAN (mise à disposition de disques virtuels, au niveau bloc, pour les serveurs virtuels) est lui aussi sécurisé de 3 manières :

  • réplication synchrone des données de la baie primaire sur la baie secondaire (2 sites géographiques distincts)
  • backup traditionnel (Networker copie périodiquement les données sur le DataDomain)
  • backup des machines virtuelles (AVAMAR copie périodiquement les VM sur un autre matériel, ce qui nous met à l’abri d’une défaillance du logiciel ou du matériel).

Comme vous pouvez le constater, le Ci et l’UNIL mettent les moyens pour réduire au maximum le risque de perte de données !

Quelle période de rétention espérer ?
1 mois garanti avec une granularité au fichier près. L’objectif est d’arriver à 3 mois. Au Ci nous sécurisons aujourd’hui 1 Péta de données. Notre nouveau NAS Isilon est un filesystem qui peut presque croître à l’infini. Il est très pratique de disposer d’un système unifié, mais cela remet en cause les méthodes de stockage traditionnelles. Pour l’instant tout est conservé, mais il faudra penser le cycle de vie des données. Pensez à votre cave : même si vous gardez tout, savez-vous ce qu’elle contient ? Après un certain temps vous rachèterez l’objet, même s’il git, oublié, au fond de votre cave. C’est la même chose en matière de sauvegarde.

Comment restaurer mes données ?
S’il s’agit d’une VM hébergée au Ci nous pouvons restaurer la machine complète à l’état de la veille (AVAMAR + Networker).

Pour une machine exploitée hors Ci mais sécurisée par le Ci (Networker), le Ci peut restaurer les données à l’état de la veille, mais pas la machine complète ! A l’administrateur système de savoir comment sauvegarder par exemple ses bases de données afin d’obtenir des fichiers exploitables.

En ce qui concerne des données hébergées sur le NAS, sur Windows un clic droit sur le fichier montre les snapshots existants. Sur Mac il faut mettre en évidence un fichier caché. En cas de données effacées il faut parcourir le snapshot existant pour retrouver le fichier.

En résumé : contactez notre help desk 😉

Pourquoi la direction de l’UNIL a-t-elle demandé un SLA dédié à la sauvegarde ? De quoi s’agit-il ?
Il s’agissait de renouveler un SLA existant. Le but était de formaliser des objectifs en matière de sauvegarde. Le Ci garantit 1 mois de rétention, et tente d’aller vers 3 mois. La norme en la matière est de 15 jours, nous offrons donc un service luxueux sur ce point.

Y a-t-il des données plus précieuses que d’autres et donc des régimes de faveur ?
Un projet va être lancé pour qualifier les données, afin par exemple de savoir comment placer des données moins précieuses sur des disques plus lents. L’idée est de limiter les coûts et le nombre de machines. Le Ci ne peut pas qualifier les données seul. La direction a déjà qualifié les données suivantes comme « vitales » (sécurisées à la transaction près chaque heure) :

  • SAP
  • Campus Card
  • dossiers académiques des étudiants.

Pour l’instant le Ci fournit des espaces à l’image d’un cargo qui transporte des containers dont il ignore le contenu, d’où un traitement a priori identique.

Pourra-t-on encore sauvegarder dans 5 ans, avec des utilisateurs qui ont des serveurs qui génèrent des To de données chaque mois ? Faudra-t-il changer de paradigme, faire un tri drastique ou changer de technologie ?
Le réseau côté serveur est passé de 1 Go/s à 10 Go/s, mais l’efficacité réelle n’a pas été multipliée par 10. C’est la même chose en matière de sauvegarde : les disques ont plus de capacité, mais la vitesse n’a pas crû suffisamment pour garder les anciennes méthodes. Il faudra donc continuer à faire évoluer les stratégies pour s’adapter. Plus la simplicité est de mise côté utilisateur, plus la complexité sous-jacente est grande. Un joli défi à relever !

Pour évoluer nous sommes obligés d’aller vers des composants fermés, simples côté utilisateur, mais en fait très complexes. A l’image d’un iPad.

Les données de mon serveur semblent en sécurité alors… comment sauvegarder au Ci les données de mon ordinateur personnel ?
Lisez l’article sur CrashPlan.
Il s’agit d’une problématique tout à fait différente : machines nomades, divers OS gérés par autant de personnes qu’il y a de machines, … tout un programme !