Updates


Event Date Summary
The computes nodes are back to running jobs. --- Les nœuds de calculs sont de retour à prendre des jobs
Many compute nodes are still not accessible, which causes longer wait time in the scheduler queue. A manual action on site has to be taken for each node that cannot be rebooted with usual remote tools. We thank you for your patience and understanding. --- Plusieurs nœuds sont encore inaccessibles, ce qui rallonge le temps d'attente dans l'ordonnanceur. Une manipulation au centre de données est requise pour chaque nœud qui ne peut être redémarré à distance avec les outils habituels. Nous vous remercions pour votre patience et votre compréhension.

Incident description

System Incident status Start Date End Date
Béluga Closed No closed date
Created by Pier-Luc St-Onge on

Title


Short power outage - Courte panne électrique


Summary


There has been a power outage at this site, which caused most compute nodes to reboot. We are progressively recovering the whole cluster. / Il y a eu une panne de courant sur ce site, ce qui a causé le redémarrage de la plupart des noeuds de calcul. Nous sommes en train de restaurer la grappe de calcul.


Updated by Pier-Luc St-Onge on