Pour ça, il faudrait une fonction qui à partir d'un mot génere "quelque chose", je sais pas encore quoi : soit une sorte de hash, soit une autre chaine, peu importe (c'est justement le but de ce topic), de façon à ce que deux mots proches une fois passés sous cette fonction donnent le même résultat, ou bien des résultats qu'on puisse associer facilement.
Par exemple, prenons quelques couples de mots "à peu près identiques" : balle/balles, étiré/étirer, attentif/attentive, etc... Il faudrait que la fonction ressorte pour "balle" et "balles" le même résultat, ou bien deux résultats qui nous permettront facilement de dire que "balle" et "balles" sont à peu près identiques. Idem avec les autres couples.
J'ai quelques idées en tête mais aucune ne me semble vraiment performante, et je ne suis même pas sûr de la meilleure forme pour le résultat de la fonction, celui sur lequel les comparaisons seront faites.
En esperant que la question soit compréhensible (ce dont je doute, j'ai l'impression de ne pas avoir été très clair ^^), y a-t-il des algorithmes connus pour ce genre de choses, ou bien l'un d'entre vous a-t-il en tête une solution efficace ?
