Comment la canicule de 2022 a semé le chaos dans les hôpitaux londoniens. Et quelques leçons.

Nous sommes à la mi-juillet 2022, l’Europe de l’ouest fait face à une des vagues de chaleur les plus intenses de son histoire. En Angleterre, pour la première fois, il fait plus de 40°C.

19 juillet, 13h, plus rien ne marche...

Le 19 juillet, à partir de 12h50, les serveurs d'un datacenter exploité par le NHS, le système de santé britannique, cessent un à un de fonctionner. A 13h15, la connection avec un autre datacenter londonnien du NHS est perdue. En quelques minutes trois hôpitaux et tous le services associés perdent l'ensemble de leurs systèmes d'information.

On ne retombe pas au Moyen Age mais on retourne bien un quarantaine d'années en arrière.... Pour plus de 23.000 salariés - médecins, infirmiers, personnels administratifs - il n’est plus possible d’accéder au dossier d’un patient, de savoir s’ils ont un rendez-vous ou de consulter des résultats d’analyse. Il faut de nouveau apprendre à travailler avec un stylo, un téléphone et une paire de basket pour courir entre les archives et les labos.
Dans un contexte de vague de chaleur, avec un afflux de patients aux urgences, c’est une catastrophe. Les hôpitaux ne peuvent plus fonctionner qu’au ralenti. La situation ne reviendra à la normale que le 21 septembre, plus de deux mois après.

Que s’est-il passé ? Comment deux datacenters indépendants, critiques peuvent tomber en panne au même moment ?
L'explication est en réalité toute simple : leurs systèmes de refroidissement, comme tous les systèmes de refroidissements, étaient conçus pour fonctionner jusqu'à une température maximale et ces hypothèses étaient trop basses.

Avec les températures atteintes à l'extérieur le 19 juillet vers midi, les climatiseurs étaient incapables de maintenir la température désirée à l'intérieure : celle-ci n’aurait jamais du dépasser 26°C, elle est montée au-delà de 50°C ! Dans ce cas, si vous avez de la chance vos serveurs vont s’arrêter automatiquement et se mettre en sécurité mais il y a aussi de bonnes chances que certaines machines crament.

Le climat du passé ne permet plus de connaitre le climat de demain, ni même d'aujourd'hui...

Mais "qui aurait pu prévoir" ? Dans un pays connu pour la fraicheur de son climat, où jamais un thermomètre n'était monté au-delà de 38.7°C, pourquoi aurait-il fallu que les infrastructures soient capables de fonctionner au-dessus de 40°C ? 

C'était oublier le changement climatique. 

L'hypothèse que le climat est stationnaire, c'est-à-dire que vous pouvez savoir ce qui va se passer demain en observant ce qu'il est arrivé hier, était peut-être raisonnable au XXe siècle, elle ne l'est plus du tout aujourd'hui : si vous concevez quelque chose à partir de 30 années d’observations météo, par exemple 1991-2020, vous vous appuyez en fait sur un climat moyen de 2005 ! Il y a de fortes chances que votre hypothèse ne soit déjà plus valide à l’instant où vous la calculez. Et plus votre projet a une durée de vie longue plus, il y a de chance que votre hypothèse soit dépassée.

Cette erreur est encore extrêmement fréquente. Au moment où les hôpitaux de Londres plongent dans le chaos, Oracle et Google rencontrent eux-aussi des problèmes dans leurs datacenters de Londres.

D'après le rapport d'enquête qui a suivi cet incident, la plupart des datacenters britanniques sont conçus pour pouvoir fonctionner normalement jusqu'à 40°C et s'arrêter à 45. Pour les installations plus anciennes, conçues avant 2010, c'est plutôt 35 et 40°C. La vague de chaleur de juillet pouvait donc potentiellement perturber toutes les infrastructures numériques du pays...

Les projections climatiques : un recours indispensable mais encore rare

Alors si on ne peut plus utiliser le passé pour savoir à quel type de météo s'attendre dans le futur, est-ce qu’il y a une solution ?

C’est ici qu’un demi-siècle de recherche sur le climat deviennent utiles...

Un immense travail scientifique a été accompli depuis les années 80 pour modéliser le climat. On dispose aujourd'hui de simulation détaillées du climat futur qui, traitées correctement, peuvent permettre d'anticiper des phénomènes qui ne se sont pas encore produits. Mieux : on a maintenant suffisamment de recul pour savoir que les projections publiées il y a deux ou trois décennies étaient fiables.

C'est presque une boule de cristal... Son utilisation permettrait d'éviter ou de minimiser les dommages causés par le changement climatique. Et pourtant, elle reste peu utilisée : en 2019, une étude d’I4CE estimait qu’à peine une entreprise sur 40 avaient déjà évalué les risques climatiques physiques pour son activité. Le chiffre a peut-être un peu augmenté depuis, mais on est certainement encore loin d'un usage généralisé.

Faciliter l'accès à la prospective climatique pour accélerer l'adaptation

Ce retard s'explique assez facilement. Imaginez que vous soyiez en train d'écrir le cahier des charges pour une nouveau datacenter et que vous vouliez déterminer la température maximale à laquelle il doit pouvoir fonctionner pour ne pas être mis en défaut entre aujourd'hui et, disons, 2040.

Comment faire ?

  • D'abord, il va falloir que vous accédiez aux projections climatiques disponibles, par exemple CMIP6 ou Cordex. Il faut savoir où les trouver, savoir les choisir, savoir les télécharger... et avoir le temps : les jeux de données sont très lourds et si vous travaillez avec plusieurs modèles (ce qui est évidemment une bonne pratique), les téléchargements peuvent facilement prendre plusieurs semaines !
  • Une fois le téléchargement terminé, vous constaterez que les fichiers sont au format netCDF, un format qui n'est pratiquement utilisé qu'en climatologie. Il vous faudra pourtant trouver une solution pour les ouvrir et extraire le site et la période de temps qui vous intéressent.
  • Pour s'assurer de la qualité du résultat, il faudra ensuite appliquer des techniques de descente d'échelle et de correction de biais.
  • Ce n'est pas terminé : si vous voulez calculer une température maximale telle que la probabilité de dépassement soient inférieure, par exemple, à 1% par an, il faudra aller chercher, du côté de la statistique, la théorie des valeurs extrêmes.

Il est facile de comprendre que ce sera une étude longue compliquée. Elle nécessite des compétences très particulières, elle va prendre beaucoup de temps et probablement couter cher. 

Cependant, ce dont on s’est aperçu, c’est qu’étudier les impacts du changement climatique c’est très souvent refaire la même chose. Si vous vous posez la même question pour un autre projet de datacenter, peut-être Paris ou Francfort au lieu de Londres, vous allez suivre les mêmes étapes en changeant simplement le point de données utilisé.

Ce que ça signifie, c'est que pour rendre la prospective climatique accessible, il faut se spécialiser : si vous identifiez un besoin récurrent, ça a un sens d’investir pour apprendre à maitriser la méthodologie, voire pour l'automatiser. La première étude va vous coûter très cher, mais vous pourrez ensuite reproduire à la demande n’importe-où dans le monde.
Cette automatisation, c’est le cœur de métier de Callendar.

 

Cet article reprend une intervention le 12 septembre 2023 lors d'une table ronde organisée par le Club Sustainable Business et le Club Immobilier Villes et Territoires des diplômés de l'ESSEC :

Publié le 13 septembre 2023 par Thibault Laconde

Aucun commentaire:

Enregistrer un commentaire