Même les centrales nucléaires font régulièrement des arrêts de tranche planifiés, ne serait-ce que pour changer le combustible, et les avions usuels passent rarement plus de 20h consécutives en l'air. Les ordinateurs qui ne doivent pas avoir de downtime ne sont pas si nombreux que ça - et pour certains, ça signale davantage un problème d'architecture / conception du système qu'une nécessité opérationnelle vitale dans un système critique... Certains types de matériel médical sont réellement vitaux, mais ceux-là ont de très grosses contraintes de certification et qualification, donc ils ne sont pas du tout / peu concernés par des mises à jour de leur firmware.
Qu'ils soient avec ou sans reboot, le simple fait que que des mises à jour des BIOS et autres firmwares BMC soient réalisées serait déjà un gros changement pour beaucoup d'entités. Ce n'est (souvent ?) pas parce que la mise à jour des firmwares nécessite downtime qu'elle n'est pas réalisée, c'est parce qu'on se fout de la sécurité qui ça coûte soi-disant trop cher. Idem pour le non-changement des mots de passe par défaut d'éléments comme la MEBx ("admin") et la non-désactivation du vilain AMT.
Et je suis d'accord, si une mise à jour des firmwares sans reboot (chez la petite minorité qui l'effectuera...) peut être une bonne chose pour la sécurité, elle retarde la découverte de problèmes matériels. Des machines qu'on ne reboote jamais pour appliquer les mises à jour du kernel et a fortiori du BIOS parce que PRODUCTION, beaucoup d'informaticiens professionnels en connaissent. Et puis quand il faut vraiment rebooter, voire arrêter temporairement la machine, pour une raison ou une autre, alors c'est là qu'on se rend compte que la pile "CMOS" est morte donc tous les réglages sont perdus (y compris ceux du BMC, donc intervention physique sur la machine pour la remettre d'aplomb), ou bien un ventilateur force tellement qu'il parvenait encore à tourner quand il était lancé mais il n'est plus opérationnel quand le reboot a fait varier fortement la vitesse du ventilateur à la baisse, un disque dur peut ne pas tolérer un spin-down+spin-up, et j'en passe. Deux des trois exemples que je donne sont du vécu personnel.
Un système fiable est un système redondant qui redémarre rapidement à l'état précédent, pas un système qu'on ne reboote jamais. Mais allez faire comprendre ça aux bean counters.
SCPCD 2021-12-30 at 12:07pm je pensais plus à un truc du genre que si on peut faire des maj de bios à chaud, qu'il devait donc y avoir plus de risque d'avoir une potentiel faille permettant de faire un patch du bios sans que l'on s'en rende compte.
Et oui, un système que l'on reboot jamais est risqué.
J'ai déjà eu des trucs où une coupure électrique inattendu (dégâts des eaux) à provoqué des soucis car certaines personnes ont "oublié" de faire une sauvegarde de la conf en cours d'utilisation (genre switch/borne wifi voir FW)...
Yep je sais pour le watercooling, c'est pas hyper simple. Par contre pour la climatisation des salles serveurs, c'est une vraie solution (mais chère).
Pour le passif... ARM en le vent en poupe ?
Arm chauffe, 100% passif pour de la puissance de calcul ce n’est pas possible.
Proud to be CAKE©®™
GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.
En effet, j'aurais pu citer l'alim au mieux capable d'allumer la led standby mais incapable de démarrer la machine complète, car c'est également du vécu pour moi, sur la machine de format tour dont les deux ventilos - processeur et boîtier - ne voulaient plus tourner.
Ceci dit, si je me souviens bien, l'alim a cramé sans reboot: un jour, la machine était présente et logwatch m'a envoyé l'habituel mail quotidien, et le lendemain, plus rien. C'était une alim nettement sur-dimensionnée: 650 W pour un AMD FX-8150 de TDP 125 W, 4 barrettes de DDR3, 2 HDD 3.5", la carte mère avec iGPU, les deux ventilos 120mm processeur et boîtier.
L’alim est souvent le problème numéro 1 d’une machine qui ne redémarre pas, surtout serveur qui restent en marche h24
Proud to be CAKE©®™
GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.
C'est pour ça qu'il y en a 2 sur un bon serveur (ce qui n'est pas le cas de mon microserver, bien sûr).
Bien sur, enfin tous ne sont pas équipé, la plupart des racks ont l'emplacement pour deux, mais ne veux pas dire que les deux alims sont montée. (j'ai un serveur qui a l'emplacement pour les deux alims et une seule présente)
Proud to be CAKE©®™
GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.
Ah oui, c'est pas livré avec 2x alims en SKU standard. Il faut payer, bien sûr.
Mais sur n'importe quel service un tant soit peu haute-dispo, il faut prendre la 2e. (Et la brancher...)
Oui, une seule alim est présente sur le PowerEdge R815 (Opteron Bulldozer 4S) d'occasion que j'ai reçu il y a quelques jours.
Uther 2021-12-30 at 10:13pm Tous les PowerEdge qu'on utilise au boulot ont deux alims fonctionnelles, même si tous n'ont pas les deux branchées.
Le serveur 1U que j'ai (une vieillerie a base de P4) peux avoir 2 alims, mais une seule est dans la machine (et c'était une des plus récente que j'avais récupéré (de mon premier boulot) sur un coup de tete, jamais vraiment eu l'intérêt de cette machine XD)
Proud to be CAKE©®™
GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.
N'oublions pas la blague classique du serveur qui a deux alims... branchées toutes les deux sur la même multiprise et/ou sans onduleur ^^
—
Zeroblog —
« Tout homme porte sur l'épaule gauche un singe et, sur l'épaule droite, un perroquet. » —
Jean Cocteau
« Moi je cherche plus de logique non plus. C'est surement pour cela que j'apprécie les Ataris, ils sont aussi logiques que moi ! » —
GT TurboLes alims crament plus a cause de la chaleur et des condensateurs chimiques qui sèchent avec le temps qu'autre chose.
Proud to be CAKE©®™
GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.
Heu il vaux mieux que les deux alims soient ondulé, mais sur deux réseau différents. Si un réseau d'onduleur tombe en panne l'autre devrait toujours fonctionner.
Si tu met secteur + onduleur tu as toutes les chances de tomber en rade si l'onduleur ne kick pas. (et ca arrive plus souvent qu'on ne pense)
Proud to be CAKE©®™
GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.
Ah, un réseau électrique triphasé à l'arrivée, plus ou moins équilibré manuellement, partagé en une partie non ondulée et une partie ondulée sur chaque phase, avec de petits onduleurs dédiés pour certains petits groupes d'équipements critiques (ordinateur de contrôle d'accès des locaux, etc.)... le problème est que CA COUTE CHER !
J'ai récupéré un NAS QNAP en 1U qui a deux alims et une entrée 220V
c'est juste pour changer le bloc d'alim si un crame.
flasher un bios depuis linux me semble un fameux souci de sécurité
puis franchement, on a pas besoin du bios/fw si la machine ne reboote pas
le firmware ne servant qu'au reboot, je vois pas a quoi ca sert de le MAJ sans avoir a redémarrer...
ptet pour les trucs style IDRAC?
Uther 2022-03-07 at 07:53am Tu peux aussi vérifier si tu n'a pas libcaca d'installé.
Ils sont sous WTFPL en plus.
"- Nigga you know what the fuck I want, nigga: I want your motherfuckin' Daytons, and your motherfuckin' stereo! And I'll take a double burger with cheese!
- WHUT?"
I LOVE TO HATE/I HATE YOUR LOVE -AND I CAN'T FEEL AFFECTION FOR PEOPLE LIKE YOU!
CAALGOOONNNNN [TELLMESOMETHINGIDONTKNOW SHOWMESOMETHINGICANTUSE PUSHTHEBUTTONS CONNECTTHEGODDAMNDOTS] (Si Dieu existe il doit me détester...)