Stockage réseau à l’UNIL : la barre du péta est franchie

par Vincent Roubaty, groupe production et systèmes, Ci-UNIL

Avec 216 téra lors de sa mise en service en 2012, la capacité totale brute du NAS Isilon est passée aujourd’hui à près de de 1.28 péta (environ 256’000 heures de films HD), soit une augmentation de plus de 600% en 5 ans.

© macrovector – Fotolia

Mais un NAS ? C’est quoi ?

NAS est l’acronyme de Network Attached Storage : littéralement stockage connecté au réseau. En simplifiant, c’est un gros serveur de fichiers optimisé permettant de stocker des données limitées en volume par un quota modulable et accessible via les protocoles SMB/CIFS et/ou NFS.

Le NAS du Ci est un NAS EMC Isilon, soit un cluster composé de différents nœuds contenant chacun du stockage disque et de la puissance de calcul et ne présentant qu’un seul système de fichier (OneFS). Il est du type scale-out, c’est-à-dire que chaque nouveau nœud augmente le volume de stockage et la performance. De 3 nœuds capacitifs en 2012, le NAS de production est aujourd’hui composé de 18 nœuds avec 9 nœuds capacitifs et 9 nœuds performants.

Le système de fichiers OneFS permet de ne gérer qu’un seul volume même s’il est de plusieurs péta. Son architecture scale-out permet d’augmenter la capacité au fil des besoins, sans perdre en performances.

Et la sécurité des données ?

La sécurisation des données déposées sur le NAS s’effectue de plusieurs manières et à plusieurs niveaux :

  • écritures multiples
  • snapshots
  • réplication
  • et 3ème copie.

Ecritures multiples :
permettent de se prémunir contre la perte simultanée de 2 disques ou d’un nœud complet. Les données déposées sur le NAS sont découpées en blocs qui sont écrits chacun en plusieurs exemplaires à emplacements différents. En cas de perte de disque ou d’un nœud complet, le NAS reconstruit les blocs perdus pour conserver le même niveau de protection.

Snapshots :
permettent de se prémunir contre une suppression accidentelle des données par l’utilisateur. Deux fois par jour à 12h00 et 18h00, des images de l’état des données sont prises et conservées jusqu’à 3 mois permettant ainsi à l’utilisateur de pouvoir récupérer lui-même un fichier/dossier à un état antérieur.

Ces 2 sécurités ont évidemment un coût sur la capacité de stockage totale puisque la copie multiple des blocs ainsi que les snapshots occupent de l’espace disque. Le volume de cette protection varie en fonction du taux de modification des données, du nombre de nœuds du NAS.

Réplication :
permet de se prémunir contre la perte totale du cluster de production. Un mécanisme de réplication transmet toutes les 4 heures les modifications de données apportées sur le cluster de production vers un second cluster de réplication, tous deux situés sur le campus. En cas de perte totale du cluster de production et après une opération manuelle de basculement, l’accès aux données restera possible vers le cluster de réplication.

3ème copie :
permet de se prémunir de la perte éventuelle des 2 NAS simultanément. Dans le cas très peu probable où un problème technique ou logiciel affecterait les NAS de production et de réplication pour les rendre illisibles, une 3ème copie des données est effectuée sur un système différent. Jusqu’à présent, cette 3ème copie est déposée sur un système avec une baie de stockage DataDomain, qui ne permet pour une raison de coût élevé, qu’un délai de rétention des données très court. Cette 3ème copie est donc en priorité à réserver aux données précieuses.

Et demain ?

Le NAS Isilon peut être maintenu à jour ou étendu par le remplacement des vieux nœuds et/ou l’ajout de nouveaux nœuds souvent plus performants et plus capacitifs. La limite du nombre de nœuds possibles dans un cluster Isilon est fixée par le nombre de ports du switch InfiniBand interne. Actuellement la limite maximale est de 144 nœuds permettant d’obtenir plus de 68 péta de capacité totale.

Pour la 3ème copie, le Ci est en train de mettre en place un nouveau système basé sur un stockage objet constitué par une baie de disque ECS et le logiciel de sauvegarde ADA permettant un coût au téra plus bas que le système DataDomain. Sur ce système, la sauvegarde des données est basée sur une première sauvegarde complète et des sauvegardes incrémentales.