PpHd (./10) :
Bref je ne sais pas comment rendre le modèle mémoire du C (un seul espace mémoire pour l'application) compatible avec Open* (Plusieurs espaces mémoires sont disponibles) tout en gardant les choses simples.
Là je ne sais quoi te répondre. Est-ce que la Local Memory doit être gérée comme une sorte de cache ou bien comme une éventuelle extension de mémoire ? pour ma part je gérerais cette mémoire comme une sorte de cache qui a beaucoup moins de latence que la Global Memory.
Le modèle mémoire du C est certes simple, mais quand tu regardes le proc sur lequel il s'exécute il y a entre 1 et 3 niveaux de cache.
PpHd (./10) :
Je ne comprends pas. IEEE 754 n'impose pas grand chose dans mes souvenirs pour exp et cos.
Seulement pour + * - / et sqrt
Par contre, opencl impose des précisions pour chaque opération (pas très élevés par ailleurs).
yep, en effet, autant pour moi. Mes infos sont obsolètes sur la normalisation dans le GPU NVidia... la norme IEEE 754-2008 a ajouté le FMA. Et il n'y a pas de norme sur cos et exp.