MeowcateLe 08/10/2018 à 12:30
Blague à part, le RNN n'a pas d'objectif fixe, il ne sait pas ce qu'on attend de lui. La phase de training lui apprend à reconnaître des patterns, et de cela il peut en déduire plus tard des constructions plausibles.
Le robot ci-dessus à un objectif (atteindre un point A) sans programmation de comment y parvenir. En testant différents éléments avec lesquels il peut interagir, ses capteurs remarquent un déplacement dans la bonne direction. Il réutilise alors ces paramètres, et rajoute des variations, pour chercher une méthode plus efficace. Il continue ainsi jusqu'à être au pic probable de son efficacité : il s'est construit là dessus selon ses expériences précédentes vers un objectif connu.
Le RNN, lui, est l'inverse. Il part de données déjà connues comme valables (pour lui, aucune de ces données n'est "fausse"), mais il n'a pas d'objectif connu. Son but est juste de comprendre comment certaines séquences peuvent se succéder à d'autres. Si son apprentissage contient mille fois le mot "yaourt" au milieu de divers phrases, il va reconnaître la séquence "yaourt". Mais si "yaourt" est à chaque fois placé comme "le yaourt c'est bon" (dans un entrainement suffisamment long), il ne reconnaîtra pas le mot "yaourt" mais uniquement "le yaourt c'est bon". L'avantage est que cela permet de former des samples finaux qui effectivement "ressemblent" au matériau d'origine. Mais on ne peut tirer de cela une création originale potentielle du matériau d'origine, sauf par un heureux hasard.