Retour sur une panne d’électricité et son impact sur l’informatique à l’UNIL

par Daniel Henchoz, production & système, Ci-UNIL

Coupure d’alimentation électrique sur le site de Dorigny de 15h22 à 15h46 le 26 mai 2014 : les conséquences pour les services informatiques centraux.

breve14_panne_courant_
© Trezvuy – Fotolia.com

Le 26 mai dernier, le site de Dorigny a subi une coupure de l’alimentation électrique générale. Selon les services industriels, « La panne est due au fonctionnement d’un système de sécurité, la protection du jeu de barres haute tension du poste d’injection ». Comprenne qui pourra, le fait est qu’il n’y avait plus d’électricité sur le campus.

A 15h22, l’éclairage dans nos bureaux a été modifié (enclenchement de l’éclairage de secours) et l’ambiance sonore a été modifiée (arrêt de bon nombre de postes de travail). Pour nous, chargés de production au Centre informatique, c’est le début de l’inquiétude en attendant que l’alimentation soit rétablie.

Nous gérons trois salles informatiques différentes dans lesquelles sont répartis nos équipements. Seule la plus récente de ces trois salles, dans le bâtiment Géopolis, est sécurisée avec un groupe électrogène indépendant, qui nous a permis de passer sereinement le cap de la panne électrique. Les deux autres salles sont équipées d’onduleurs qui puisent leur énergie dans des groupes de batteries pour fournir l’énergie au parc informatique.

Ces onduleurs sont dimensionnés pour secourir le parc pendant 10 minutes lorsque la salle fonctionne à pleine charge. Dans le cas qui nous occupe, la panne a duré 24 minutes, l’alimentation a été rétablie à 15h46. Nous avons donc commencé à stopper certains serveurs gourmands en électricité et non indispensables au fonctionnement des services centraux de base, afin d’étendre le plus possible la plage pendant laquelle les onduleurs pourraient fournir l’alimentation. Cette mesure a pu être prise dans la salle de l’Amphimax qui jouxte nos bureaux. Nous ne sommes pas intervenus à la salle de l’Internef qui d’ailleurs partage ses onduleurs avec les pompes de relevage des eaux usées du bâtiment.

L’intervention manuelle a été possible puisque cette panne est survenue pendant les heures de bureau. Si la panne s’était produite durant la nuit les conséquences auraient été plus importantes et nos utilisateurs auraient forcément subi des perturbations le lendemain, le temps de remettre tous les services en place.

Une grand partie de nos services sont configurés de manière redondante, afin de nous prémunir contre des pannes matérielles ou mauvaises manipulations « humaines ». La panne électrique de longue durée sur un des sites engendrerait probablement des perturbations et certainement des risques de perte de données nous obligeant à mettre en œuvre des procédures de récupération. Ces travaux prendraient forcément du temps et perturberaient le fonctionnement des services centraux pour plusieurs heures. Il serait beaucoup plus rassurant pour l’UNIL de pouvoir disposer d’un deuxième groupe électrogène pour la salle de l’Amphimax…

La fréquence des coupures d’alimentation du réseau de ville est aujourd’hui encore assez basse. Cependant il n’est pas certain que la qualité de l’approvisionnement électrique en Suisse reste à ce niveau de fiabilité à l’avenir, en raison de la forte croissance de la demande.

Pour cette fois, nos utilisateurs ont relativement peu été impactés. Seuls certains clusters de calcul (gros consommateurs de courant) ont été stoppés, ce qui représente tout de même une perte de temps pour certains chercheurs de l’UNIL.

Lien :
la panne dans la presse.