J'ai un programme de bench:
Grosso modo:
cycle = (cpuid(), rdtsc()); ma_func (); cycle = (cpuid(), rdtsc()) - cycle;
Sur P4, une boucle vide (ma_func() = rien) est plus lente qu'un appel de fonction complexe (addition de deux flottants multiprecisons) !!!!!!!!!!!!!!!!!!
Quelle belle machine !
(Boucle vide: 540 cycles, contre 500 pour l'autre)...