Updates


Event Date Summary

The following services are now accessible:

  • Béluga Cloud
  • Narval, except the daily backup (to reactivate this Tuesday)

Our teams are still working to restart:

  • Béluga (HPC)
  • Juno Secure Cloud

We expect these services to be accessible tomorrow during the day, Tuesday, June 13, 2023.


Les services suivants sont à nouveau accessibles :

  • Béluga Cloud (le système infonuagique)
  • Narval, sauf la sauvegarde quotidienne (à réactiver ce mardi)

Nos équipes travaillent encore à redémarrer les infrastructures suivantes :

  • Béluga (la grappe de calcul)
  • Juno nuage sécurisé-Secure Cloud

Nous estimons que ces services seront de retour au cours de la journée de demain, le mardi 13 juin 2023.

On June 10th, 2023, there was a power outage at ÉTS. Our teams are currently restarting the various systems, and they should be accessible by the end of the day.

The power outage has affected Béluga and Narval compute nodes, their login nodes, storage systems and the entire Béluga Cloud and Secure Cloud infrastructure. If you were transferring files, you will have to resume your transfers. If you have any cloud instance in production, we recommend validating the storage volumes’ integrity while booting your virtual machines.

If you have any questions about this outage, please contact support@tech.alliancecan.ca.


Une panne électrique a affecté l’ÉTS le 10 juin 2023. Nos équipes redémarrent actuellement les différentes infrastructures, et elles devraient être accessibles d’ici la fin de la journée.

La panne électrique a affecté les nœuds de calcul de Béluga et Narval, leurs nœuds de connexion, le stockage et toute l’infrastructure infonuagique Béluga Cloud et Secure Cloud. Si vous étiez en train de transférer des fichiers, il vous faudra reprendre ces transferts là où ils étaient rendus. S’il y a lieu, nous vous recommandons de valider l’intégrité de vos volumes de stockage infonuagiques au moment de démarrer vos machines virtuelles.

Si vous avez des questions, veuillez écrire à support@tech.alliancecan.ca.


Incident description

System Incident status Start Date End Date
Narval Closed No closed date
Created by Cristian Gergely on

Title


Panne de courant - Power outage


Summary


Hello. Following a generator load anomaly, the clusters are down, including the HA room (storage and network) and the clouds. We will restart everything on Monday. Please announce your users! Sorry for all that, it was not planned at all.

/

Bonjour. Suite à une anomalie de la charge du générateur, les clusters sont down, y compris la salle HA (stockage et réseau) et les clouds. Nous allons tout redémarrer lundi. Veuillez annoncer vos utilisateurs ! Désolé pour tout ça, ce n’était pas du tout prévu.


Updated by Pier-Luc St-Onge on