DEATHLe 10/05/2021 à 21:38
Pour l'optimisation j'ai étudié un peu la question et finalement... On ne gagne pas grand chose même en essayant d'entrelacer le code ou de faire super attention.
Le problème c'est que le nombre d'accès aux registres n'est pas correctement proportionné par rapport à la taille du pipeline.
Avec "seulement" un double port et 1 seule écriture, on arrive facilement à saturation avec un pipeilne à 3 stages
à priori la bonne valeur ça serait un triple port avec double écriture aux registres