19Fermer21
ZerosquareLe 13/03/2020 à 16:28
Très intéressant !

Godzil (./17) :
Zero: gcc et clang le font déjà de base avec les option d’optimisation de base (juste -O3, on peux ajouter -march=native pour utiliser le meilleur set pour le CPU courant), c'est assez impressionnant a vrai dire.
Oui, le compilo peut vectoriser ton code automatiquement dans une certaine mesure, mais je pense que tu aurais des perfs encore meilleures en construisant ton algo directement sur la base d'instructions AVX.

bearbecue a été invitée sur ce sujet.