Ben, un test exhaustif testerait les 2⁶⁴ combinaisons possibles pour s'assurer qu'elles sont toutes parfaitement gérée.
Il y a sans doute plusieurs façons de procéder pour parvenir à ce résultat :
1. Tu peux recourir à un observateur externe (i.e. un logiciel qui tourne sur PC) pour analyser les résultats d'addition (incluant les flags) et les valider par rapport à un calcul de référence.
2. Tu peux réduire le test à un nombre fini mais potentiellement important de cas.
3. Tu peux calculer un hash relativement simple (mais pas trop quand même) des résultats + valeur des flags sur la totalité des 2⁶⁴ cas, et le comparer à un hash de référence.
La seule méthode parfaitement fiable est la 1, à supposer que tu aies un moyen de communication fiable (validé) entre ton CPU et ton observateur externe (et que l'observateur externe n'induise pas d'effet quantiques sur ton CPU observé

). Sinon, pour obtenir un résultat approximativement aussi juste, il faut sans doute une combinaison des méthodes 2 et 3…
(Dans tous les cas, il ne faut pas se foirer sur le calcul de référence, bien entendu

)
./12 > Ah oui, peut-être. Mes souvenirs sont assez vagues à ce niveau
