7799Fermer7801
Lionel DebrouxLe 30/12/2021 à 11:49
Même les centrales nucléaires font régulièrement des arrêts de tranche planifiés, ne serait-ce que pour changer le combustible, et les avions usuels passent rarement plus de 20h consécutives en l'air. Les ordinateurs qui ne doivent pas avoir de downtime ne sont pas si nombreux que ça - et pour certains, ça signale davantage un problème d'architecture / conception du système qu'une nécessité opérationnelle vitale dans un système critique... Certains types de matériel médical sont réellement vitaux, mais ceux-là ont de très grosses contraintes de certification et qualification, donc ils ne sont pas du tout / peu concernés par des mises à jour de leur firmware.

Qu'ils soient avec ou sans reboot, le simple fait que que des mises à jour des BIOS et autres firmwares BMC soient réalisées serait déjà un gros changement pour beaucoup d'entités. Ce n'est (souvent ?) pas parce que la mise à jour des firmwares nécessite downtime qu'elle n'est pas réalisée, c'est parce qu'on se fout de la sécurité qui ça coûte soi-disant trop cher. Idem pour le non-changement des mots de passe par défaut d'éléments comme la MEBx ("admin") et la non-désactivation du vilain AMT.

Et je suis d'accord, si une mise à jour des firmwares sans reboot (chez la petite minorité qui l'effectuera...) peut être une bonne chose pour la sécurité, elle retarde la découverte de problèmes matériels. Des machines qu'on ne reboote jamais pour appliquer les mises à jour du kernel et a fortiori du BIOS parce que PRODUCTION, beaucoup d'informaticiens professionnels en connaissent. Et puis quand il faut vraiment rebooter, voire arrêter temporairement la machine, pour une raison ou une autre, alors c'est là qu'on se rend compte que la pile "CMOS" est morte donc tous les réglages sont perdus (y compris ceux du BMC, donc intervention physique sur la machine pour la remettre d'aplomb), ou bien un ventilateur force tellement qu'il parvenait encore à tourner quand il était lancé mais il n'est plus opérationnel quand le reboot a fait varier fortement la vitesse du ventilateur à la baisse, un disque dur peut ne pas tolérer un spin-down+spin-up, et j'en passe. Deux des trois exemples que je donne sont du vécu personnel.

Un système fiable est un système redondant qui redémarre rapidement à l'état précédent, pas un système qu'on ne reboote jamais. Mais allez faire comprendre ça aux bean counters.