Curnagl, notre nouveau cluster de calcul haute performance (HPC)

Dans tous les domaines de recherche, les moyens numériques et computationnels sont devenus essentiels et le calcul de haute performance (HPC) est un outil de travail quotidien.

Qu’est-ce que c’est « la haute performance »?

D’une manière générale, on peut dire que si les besoins de calcul, mémoire et stockage dépassent les limites d’un ordinateur personnel, nous sommes dans la haute performance. Pour relativiser, rappelons qu’un smartphone d’aujourd’hui est plus performant qu’un super ordinateur des années 1970 ! Votre mobile est donc un supercomputer des années 1970 et nos clusters de calcul correspondent peut-être à vos futurs smartphones des années 2050.

Il est certes possible de dépenser de l’argent et d’avoir un ordinateur portable ou un poste fixe très performant, mais cela s’accompagne de problèmes supplémentaires. Premièrement, comme une voiture qui reste sur le parking 99% de sa vie, notre ordinateur très performant est un gaspillage de ressources s’il n’est pas utilisé de manière intensive. Deuxièmement, il chauffe et fait du bruit. Finalement, il faut des compétences particulières pour l’exploiter et utiliser au mieux sa performance.

La vitesse avec laquelle on arrive multiplier deux chiffres comme 3.1415 x 1.3333 n’a pas changé depuis plusieurs années, et dans certains cas est même devenue plus lente. Ce qui a changé, c’est le nombre de calculs que l’on arrive à faire en parallèle, mais cela exige généralement de repenser les algorithmes. La capacité d’exécuter autant de calculs en même temps transforme notre souci de vitesse de calcul en un problème de bande passante pour alimenter les calculs en données, ce qui nécessite encore des adaptations des algorithmes et du matériel.

Le nouveau cluster de calcul: Curnagl

La Division de calcul et soutien à la recherche (DCSR) du Ci est chargée de fournir les moyens matériels (les supercomputers) et l’expertise (comment bien les utiliser et adapter les algorithmes pour en tirer bénéfice) pour toute la communauté de recherche de l’UNIL. Pour cela, nous sommes heureux de vous présenter le nouveau cluster de calcul qui vient d’être mis en service. Jusqu’à présent, la DCSR gérait deux clusters bien hétérogènes qui n’étaient pas appréciés par les utilisateurs car ils étaient difficiles d’utilisation. Ces clusters seront abandonnés dès que possible.

Le nouveau cluster s’appelle Curnagl (Chocard à bec jaune en Romanche) et se trouve dans un datacenter de l’UNIL.

Curnagl en chiffres

  • 72 nœuds de calcul, chacun avec 48 coeurs et au moins 512 GB de mémoire.
  • 12 de ces nœuds ont 1024 GB (1 TB) de mémoire et 8 sont munis des GPUs dernier cri (NVIDIA A100)
  • Ces nœuds sont connectés à un réseau faible latence (HDR infiniband) ainsi qu’à de l’Ethernet à 100 Gb/s.
  • Pour stocker les données, nous disposons de 110 TB de stockage (scratch) ultra-rapide ainsi que 1 PB de stockage sur disque.

C’est un système qui est bien sûr relativement petit par rapport à ceux du CSCS (Centre suisse de calcul scientifique à l’ETHZ) et de nos voisins à l’EPFL, mais ce n’est que le début. Ce cluster constitue des fondations solides pour assurer une croissance et une évolution selon les besoins de la recherche.

Nous vous invitons à visiter notre site web pour en savoir plus sur la DCSR, ses ressources de calcul, son expertise et les autres services offerts.

Illustration: © Hernanhyper | Dreamstime.com