bearbecueLe 15/11/2011 à 11:54
ouai, ce que dit squalyl.
Pen^2> pour les load/stores, t'as differents tags qui donnent la taille de l'operande memoire, genre byte ptr (8bits), word ptr (16bits), dword ptr (32bits), qword ptr (64bits), et xmmword ptr (128bits)
et, ouai, ce sale con, il passe tout en operandes memoires plutot que de faire des loads separes.
non seulement ca loade deux fois les donnees, MAIS surtout, il y a un stall A CHAQUE PUTAIN D'INSTRUCTION !!! vu que les minps/maxps sont obliges d'attendre que le load se fasse.. alors qu'avec les intrinsics SSE du code d'origine, visual a tout le taff deja mache, et les loads sont fait avant l'utilisation de leur resultats, ca stall quand meme un peu, mais nettement moins...