Nucléaire, IA et climat, édition 2020 : la canicule aura-t-elle raison de la centrale de Golfech ?

Le bref pic de chaleur qui a touché la France à la fin du mois du juillet a obligé la centrale de Golfech a réduire sa production. Cet épisode illustre une nouvelle fois la vulnérabilité des centrales nucléaires face aux aléas climatiques.
Il montre aussi qu'il n'est pas toujours facile d'anticiper correctement les indisponibilités causées par la chaleur : EDF a indiqué, le mercredi 29, qu'une réduction de la production pourrait être nécessaire à partir du 1er août, puis a changé d'avis le lendemain, jeudi 30, avant finalement d'annoncer l'arrêt du vendredi 31, le jour même avec moins de 4h de préavis.

Alors qu'une nouvelle vague de chaleur s'amorce,  je vous propose néanmoins de tenter l'exercice de notre coté. Dans cet article, nous allons essayer de déterminer si la centrale de Golfech (ou plus exactement son réacteur 2, le seul en service en ce moment) va, à nouveau, devoir réduire sa production dans les prochains jours.

Cet article est long et assez technique, si vous n'êtes intéressé que par le résultat, vous pouvez cliquer ici. L'article a été actualisé de façon à comparer ces résultats à ce qui s'est vraiment passé, cette actualisation est accessible directement ici.

Le principe en bref


On s'intéresse ici aux indisponibilités causées par la chaleur et plus particulièrement par le dépassement de la température maximale autorisée en aval de la centrale : 28°C dans le cas de Golfech.

Nous n'allons pas faire modélisation hydrologique ou thermique. Cela prendrait beaucoup de temps et demanderait une expertise pointue - des choses qui sont peut-être accessibles pour EDF mais pas pour la plupart des utilisateurs des fleuves qui sont soumis aux mêmes contraintes. L'objectif est de créer une solution facilement réplicable.

Notre approche est la suivante : nous allons chercher des données passées pour la température de l'air et le débit, d'une part, et la température de l'eau, d'autre part. Nous allons ensuite laisser un système d'intelligence artificielle apprendre le lien entre les deux, après quoi nous l'utiliserons pour prédire la température de l'eau à Golfech dans les prochains jours à partir d'hypothèses sur la température de l'air et de le débit.

Voilà pour l'idée. Passons à la réalisation...

Accès aux données (avec une pointe de sel)


La première étape de notre travail consiste  à trouver des données sur les température et débits passés à Golfech.

Pour la température de l'air, ça ne présente pas de difficulté. Des données très exhaustives sont accessibles sur près de 40 ans grâce à Copernicus, le programme européen d'observation de la terre.

En général, il est plus difficile de trouver des données de débit et de température de l'eau.Heureusement, dans le cas de Golfech, on est raisonnablement bien pourvu : une station de mesure située un jet de pierre en aval de la centrale, à Lamagistère, enregistre les débits depuis 1966. Elle a aussi mesuré la température de l'eau à partir de 2008, ces mesures ont cessé en 2017, c'est dommage mais 10 années de données permettent déjà de travailler.

Dans un projet comme celui-ci il est important de jeter un coup d'oeil critique aux données, surtout à celles qui vont être la cible que nos algorithmes vont apprendre à viser - ici la température de l'eau.
Il existe une seconde source sur laquelle on peut valider les mesures de Lamagistère : c'est EDF. L'entreprise ne publie pas systématiquement les données dont elle dispose mais une partie se retrouve dans les rapports annuels de surveillance de l'environnement.
La comparaison des deux permet de constater un décalage entre les mesures de Lamagistère et celle d'EDF. En 2017, par exemple, le rapport nous dit p.20 que la température maximale atteinte par la Garonne en aval est de 27.79°C le 22 juin. Les mesures de la station de Lamagistère donnent bien la maximale annuelle ce jour-là mais à 26.06°C. La comparaison du graphique de température fournit par EDF et de celui créé avec les mesures de Lamagistère montre que ce n'est pas un cas à part et suggère que les secondes ont un biais négatif par rapport aux premières.

La comparaison des valeurs maximales fournies par EDF sur plusieurs années à celle obtenues avec notre série permet d'évaluer cet écart entre 1.7 et 2.9°C.
Difficile de dire quel est l'origine de biais. Quoi qu'il en soit, ce qui nous intéresse, c'est de prédire les températures mesurées par EDF, celles qui sont utilisées pour décider de l'arrêt ou non de la centrale. Afin de s'en rapprocher, on va, faute de mieux, rajouter 2.3°C aux mesures de Lamagistère.

C:\ start Skynet.exe


Nous avons les données, il est temps de les confier à un système d'intelligence artificielle. Et plus précisément d'apprentissage machine.
 
L'apprentissage machine (machine learning en anglais) est un sous-domaine de l'intelligence artificielle. Là où des outils informatiques classiques vont s'appuyer sur des règles contenues dans leurs codes pour prendre telle ou telle décision, les algorithmes d'apprentissage machine sont capables de créer eux-même des règles.
Ils ont besoin pour celà d'un entrainement : on leur soumet des données d'entrée (appelées caractéristiques ou features en anglais) associées à un résultat connu (étiquette ou label), l'algorithme essaie de deviner le résultat à partir des données d'entrée, calcule son erreur, modifie légèrement ses règles en fonction puis recommence jusqu'à ce qu'il ne parvienne plus à améliorer son score.

Dans notre cas, on va prendre 6 caractéristiques : la température de l'air en moyenne journalière entre J et J-4, soit 5 valeurs, et le débit moyen entre J et J-4. L'étiquette que l'on cherche à deviner est la température moyenne journalière de l'eau à J.
Nous avons ces données sur près de 10 ans en 2008 et 2017. Afin de simplifier la tache de notre algorithme nous allons ne garder que les mois d'été (juin, juillet, août) soit 828 points de données. Nous allons entrainer notre algorithme sur les années 2008 à 2016 et garder l'année 2017 de coté. Cette dernière année, que l'algorithme n'aura jamais vu pendant son entrainement, nous permettra de le tester.

Une des difficultés de l'apprentissage machine est qu'il existe une grande variété d'algorithmes dont certains demande une configuration précise. Le choix n'est donc pas toujours évident.
N'ayant pas d'a priori sur le plus adapté, j'ai décidé de tester quelques algorithmes classiques. Sans rentrer dans les détails, il s'agit : d'une forêt aléatoire, d'une machine à vecteurs de support, des k plus proches voisins, d'un réseau de neurones, d'une bonne vieille régression linéaire et d'une régression polynomiale d'ordre 3.

Après entrainement, voici comment ces 6 modèles prédisent la température de l'eau à Golfech pendant l'été 2017 (que rappelons-le, ils ne connaissent pas encore) :
Le réseau de neurones est le plus performant : en moyenne il se trompe de 0.58°C. Viennent ensuite quasiment ex-aequo la forêt aléatoire et les deux régressions, avec 0.72 et 0.74°C d'erreur absolue moyenne.

Je vais garder le réseau de neurone mais aussi la régression linéaire. Pour la plupart des gens, les réseaux de neurones sont des boites noires un peu magiques, c'est souvent une bonne chose d'avoir un modèle facilement compréhensible à coté pour contrebalancer.

Utime test


Ces deux algorithmes étant choisis, on les réentraine en prenant cette fois l'ensemble du jeu de données. 
 
Avant de passer à la prévision des prochains jours, il me semble intéressant les soumettre à un dernier test.
Nous avons des données sur le débit et la température de l'air pour 2018 et 2019 mais pas de données sur la température de l'eau puisque la station a cessé de fonctionner fin 2017. Par contre on sait que la centrale nucléaire de Golfech a subi des indisponibilités climatiques du 6 au 9 août 2018 et du 23 au 29 juillet 2019.
C'est donc certainement que la température de la Garonne a dépassée la limite de 28°C au début de chacune de ces deux périodes. Cela est confirmé par les rapports de surveillance de l'environnement pour 2018 et 2019.

Voyons si nos modèles parviennent à prédire ces dépassements et donc l'indisponibilité qui en a résulté.

Voici la température de la Garonne en aval de Golfech pour l'été 2018, telle que prédite par notre réseau de neurones et notre modèle linéaire :
On voit que les modèles identifient bien le réchauffement de la première semaine d'août mais échouent juste sur la ligne avec une température maximale de 27.8°C environ. Contre 28.25°C mesuré par EDF le 6 août.

En 2019, le dépassement est plus franc : jusqu'à 29.2°C. Cette fois nos deux modèles situent bien la Garonne au dessus du seuil autorisé de 28°C. La prédiction du modèle linéaire est presque parfaite (29.12°C), celle du réseau de neurone encore un peu en dessous de la réalité (28.82°C) :
Ces deux tests sont plutôt encourageants mais  nos modèles semblent légèrement optimistes. Peut-être parce qu'on ne s'est pas tout à fait débarrassé de l'écart entre les mesures de la station de Lamagistère et celles d'EDF ? C'est quelque chose que l'on peut garder en tête pour la suite.

Alors Golfech, on l'arrête ou pas ?


Nous avons collectés des données, nous les avons corrigés par comparaison à celles publiés par EDF, nous avons entrainé et testé 6 algorithmes d'apprentissage machine, nous en avons retenu deux que nous avons retesté avec un certain succès sur les période d'indisponibilité de 2018 et 2019.

Tournons nous maintenant vers les prévisions les plus difficiles : celles qui concernent l'avenir. Qu'est-ce que ces modèles nous disent sur la vague de chaleur des prochains jours ?

Pour cette prédiction, je me suis appuyé sur une hypothèse de débit moyen constant de 90m3/s (approximativement ce qu'on observe depuis le 1er août). Les prévisions de températures sont issues du modèle ARPEGE de Météo France et vont jusqu'au 10 août. Elles donnent par exemple 30.8°C en moyenne journalière demain, 7 août.

Avec ces hypothèses, nos modèles donnent la température suivante pour la Garonne :
On devrait avoir un net réchauffement de l'eau à la hauteur de Golfech au cours des deux prochains jours avec un maximum ce week-end autour de 27.2°C. Donc encore assez confortablement sous la limite autorisés des 28°C.

Si toutefois la vague de chaleur venait à se prolonger quelques jours après le 9, la température de la Garonne se rapprocherait de sa limite en début de semaine prochaine : avec 28°C le 10 (au lieu des 24.6 actuellement prévus par Météo France) et le 11, le seuil serait atteint le 11.

Finalement que s'est-il passé ? (mise à jour du 18/8)

 
Avec le recul, le résultats sont plutôt bons sinon pour anticiper les indisponibilités de Golfech, du moins pour anticiper la façon dont EDF anticipe ces indisponibilités.

Les premiers résultats, publiés dans cet article le 6 août, suggéraient un risque d'indisponibilité à partir du 11. Ce risque a été confirmé par EDF dans un message daté du 7 août dans l'après-midi
Le lendemain, 8 août, j'ai fait tourner à nouveau mes modèles sur la base des dernières prévisions de températures. Le résultat montrait qu'un arrêt le 11 était peu probable :
 


Là encore cette prévision a été confirmée par EDF le lendemain. Un nouveau message, daté du 9 août, affirme que "au regard des dernières prévisions de température pour la Garonne, il n'est plus envisagé de restrictions de production pour le CNPE de Golfech dans les sept jours à venir."

Je n'ai pas refait d'actualisation par la suite et mal m'en a pris car finalement le réacteur 2 de la centrale de Golfech, le seul encore en fonctionnement, a finalement été mis à l'arrêt le 12 août en milieu de journée. La centrale s'est donc retrouvé complétement indisponible dans les dernières heures de la canicule.

Faute d'une dernière actualisation qui aurait peut-être (ou peut-être pas) prévu cet arrêt, le test ne peut pas être considéré comme entièrement concluant. En tous cas, les modèles parviennent apparemment à anticiper le diagnostic de l'exploitant environ 24 heures avant qu'il le communique. Je crois que c'est en soi un résultat assez remarquable compte-tenu de l'asymétrie d'information et de moyens.


Conclusion


Si vous suivez régulièrement ce blog, vous vous souvenez peut-être que je m'étais prêté au même exercice l'année dernière pour la centrale nucléaire de Saint Alban. J'espère que vous appréciez le chemin parcouru depuis...

La prévision à court-terme de la disponibilité d'une centrale nucléaire est un enjeu technique et économique important, y compris pour des acteurs qui n'ont pas accès à l'expertise et aux données d'EDF : la semaine dernière, l'annonce de l'arrêt possible des 2 réacteurs de Golfech a apparemment entrainé un bond de 10% du prix du gros de l'électricité.

Mais ce n'est pas vraiment le sujet qui m'occupe. Je suis plus intéressé par les effets à moyen-terme du réchauffement climatique.

La plupart des installations industrielles qui utilisent l'eau d'un fleuve pour se refroidir sont soumises, comme la centrale nucléaire de Golfech, à une température limite des rejets de 28°C. Ce seuil devient plus difficile à respecter avec le réchauffement et l'aridification du climat.
Beaucoup de ces installations ont aussi des durées de vie de plusieurs décennies, c'est-à-dire qu'un projet lancé maintenant devra pouvoir fonctionner au milieu du siècle. Etre capable d'évaluer rapidement les risques climatiques, non pas la semaine prochaine, mais à l'horizon 2040 ou 2050 est crucial pour adapter l'emplacement et la conception de ces projets, assurer leur viabilité et, in fine, construire une économie plus résiliente face au changement climatique.

Les centrales nucléaires sont un cas d'étude passionant, parce que nous dépendons tous directement de leurs productions et parce qu'elles s'inscrivent dans un système électrique beaucoup plus vaste et complexe, potentiellement sujet aux effets dominos. Mais elles ne sont qu'un exemple d'une vulnérabilité beaucoup plus générale.


Publié le 6 août 2020 par Thibault Laconde, mis à jour le 18 août 2020

1 commentaire :

  1. Cest intéressant de voir que tes modèles arrivent à être aussi précis! Je comprends pas trop le biais du début, je me demandais si ce n'était pas le pas de mesure qui était en jeu?
    Par contre le début de l'article est discutable: se poser la question de la résilience du nucléaire comme ca laisse qq oublis: pour le moment il y a bcp de centrales, et en été la conso est moindre, donc on se suffit de celles n'ayant pas ce pb et basta. De plus si vraiment il y a un pb sur le réseau, les petits poissons peuvent avoir chaud qq jours, la Tmax est pour la vie courante (c l'ASN qui donne le droit), mais aucun pb surete nucleaire du a la météo un peu chaude (ça se verrait par des indisponibilités matérielles, pour le moment pas de soucis à golfech)
    Enfin tu dis etre soucieux du climat: toutes les installations ont ce soucis, cest bien que tu l'aies rappelé, maintenant toutes les autres industries sont la cause du réchauffement, pas le nucléaire... ne devrait on pas rehausser cette valeur de Tmax, justement pour le climat?

    RépondreSupprimer