Pas grave. ^^
J'ai trouvé l'optimisation suivante, dans pas mal de fonctions sûrement :
movea.l (sp)+,a1
movea.l (sp),a0 / move.w (sp),d0 ;ici on récupère les deux octets perdus au début
[fonction]
jmp (a1)
on gagne 8 cycles avec le jmp par rapport au rts, au moins 4 avec la lecture du premier argument sans offset, ça coute sûrement moins que le movea du début.
Mais bon, j'imagine pas la merde pour gagner si peu
