Le mécanisme d'un logiciel de calcul formel - Page 1

1

Le 13/09/2007 à 12:56Edité par Magical42 le 16/09/2007 à 18:26

Bonjour @ tous !!!

Pour préparer un dossier sur les logiciels de calcul formel, je dois en expliquer le mécanisme.
Le point de départ est le suivant : un utilisateur saisie une expression mathématique contenant des symboles (opérateurs, fonctions mathématiques, lettres latines ou grecques, ...). Cette expression est de type chaine de caractères et non numérique bien entendu.
L'utilisateur valide sa formule et le logiciel lui retourne un résultat fomel (sous forme réduite ou développée ; conservations des symboles mathématiques tel les fractions, les racines carrés, les exposants, etc. ; les fonctions ...). Ce résultat apparait sous forme de chaine également.
Alors comment à partir d'une chaine de caractère on peut obtenir un résultat.

D'après mes recherches, j'ai trouvé un seul site traitant le fonctionnement d'un logiciel de calcul formel (http://www.studyvox.ups-tlse.fr/mathweb/mathweb_3.html). Certes il explique les grandes lignes mais c'est très flou.
Je comprends que la chaine est sauvegardé dans uen variable. Cette variable est analysée caractère par caractère (de gauche à droite). L’étape suivante consiste à trouver dans la formule : les constantes, les fonctions, les nombres et les opérateurs. La recherche est effectuée en utilisant un pointeur sur la chaîne, puis en analysant successivement les symboles rencontrés, en incrémentant le pointeur.
On place dans une liste les symboles mathématiques comme les opérateurs (+-÷⁄×*( )[ ]{ }) qui permet de séparer la formule mathématique. Quand on
rencontre un symbole mathématique qui ne joue pas le rôle de séparateur, on passe aux caractères suivant jusqu’au prochain séparateur (un opérateur mathématique).
L’expression mathématique est séparée en 3 types :
[*] En nombres entiers ou décimaux
[*] En nom de constantes
[*] En symbole mathématique ou le nom de la fonction suivie par une parenthèse ouvrante.
Par cette convention, il est possible de traiter les formules mathématiques. Par exemple, l’écriture d’une fraction fait intervenir 2 nombres, séparés par l’opérateur slash « / ». Pour effectuer des calculs relationnels, il faut bien reconnaitre les fractions avec leur numérateur et leur dénominateur.
Pour les puissances, il faut choisir une convention pour écrire la puissance d’une expression. On peut convenir un seul symbole de puissante tel que "^" suivi d’un entier.
Une fois que les conventions d’écriture des symboles mathématiques, il faut mettre en place des subroutines qui permettront d’effectuer les calculs numériques et les calculs formels.
Les calculs nécessitent de retrouver les parenthèses imbriquées, les fonctions et les opérateurs qui opèrent sur ces parenthèses, trouver les résultats partiels et les imbriquer pour trouver le résultat final. Ces opérations sont délicates car elles nécessitent de simplifier les résultats partiels et de les normaliser, pour que l’écriture de la formule mathématique soit toujours conforme aux conventions adoptées. Cette simplification nécessite le plus gros des travails en termes de programmation des calculs numériques et formels.

Voilà mais là je ne comprends plus trôt où va ce mécanisme.
Si l'un d'entre vous peux m'expliquer en terme claire et aussi avec des termes informatiques (c'est pour ma culture :P) ou me communiquer des liens WEB qui traite du mécanisme. Je serai ravi.

Pour info, le mécanisme n'est pas uniquement bordé aux logiciels de calcul formel mais ils peuvent concernés des logiciels développés en C/C++/ Pascal objet etc...

En attendant des réponses, je vous souhaite de passer une très bonne journée.
David

2

Le 13/09/2007 à 13:07

renseigne toi sur
-la compilation
-l'analyse lexicale (que tu as décrit)
-l'analyse syntaxique (traduction d'un texte en arbre de symboles, puis utilisation de cet arbre pour simplifier la formule de proche en proche)

1D86FN9
Nspire wiki
CONDUCTEUR Va-et-vient Des QUATRE MANCHE AVEC DES DIODES
La naissance de Boo en vrai

3

Le 13/09/2007 à 13:10

Squalyl merci pour ta réponse.
Le fait est que je ne suis pas programmeur même si j'ai vu ça dans les langages C/c++. Ces choses là remontent loin.

Connaitrais-tu des sites qui évoquent ce que tu m'énonces sur l'analyse lexicale et l'analyse syntaxique ?
Merci

4

Le 13/09/2007 à 13:14

google

et c'est pas de la programmation, mais de l'algorithmique

et te mets pas le doigt dans l'oeil, si tu veux étudier ce domaine en pratique, tu vas devoir programmer... sévère!

1D86FN9
Nspire wiki
CONDUCTEUR Va-et-vient Des QUATRE MANCHE AVEC DES DIODES
La naissance de Boo en vrai

5

Le 13/09/2007 à 13:59

Si je ne me trompe pas dans les termes :

L'analyse lexicale est relativement simple (le module qui fait cela s'appelle le "lexer"). L'analyse syntaxique, qui est grosso modo l'étape suivante, sert à faire une représentation abstraite des étapes du calcul (le module est appelé "parser"). Cette représentation est un arbre (les noeuds sont les opérateurs, les feuilles des variables et des constantes). L'analyse sémantique se charge ensuite de traiter cet arbre pour calculer le résultat.

Un site complet sur lequel vous trouverez des programmes et des jeux pour votre calculatrice TI 89 / Titanium / 92+ / Voyage 200 : www.ti-fr.com.
Quelques idées personnelles ici.

6

Le 13/09/2007 à 15:01

1/ T'as pas besoin de savoir programmer pour savoir comment ca marche
2/ cf la reponse de Thibaut, et regarde ce qu'est une grammaire (wikipedia toussa), la representation par arbre c'est qqch de tres naturel, tu fais la mm chose qunad tu decomposes une formule
3/ Ca se trouve generalemnet pas mal des trucs sur le calcul formel... Certaines librairies sont bien documentees (GiNaC si je me rappelle bien a une bonne doc)

http://rgaucher.info (blog:tech)
FuckTheSpam! ~ spam@fuckthespam.com

7

Le 13/09/2007 à 18:36

Voici un cours très bien fait, qui explique comment fonctionne la transformation en arbre abstrait d'une chaîne : http://sjrd.ftp-developpez.com/tutoriels/compilation/analyseurs-syntaxiques.pdf

Un site complet sur lequel vous trouverez des programmes et des jeux pour votre calculatrice TI 89 / Titanium / 92+ / Voyage 200 : www.ti-fr.com.
Quelques idées personnelles ici.

8

Le 15/09/2007 à 02:03

En fait, c'est assez sympa à faire.
par exemple tu as:
32*5+b/c-sqrt(474)

Tu parses la chaine de caractère pour construire les tokens.
En gros, ca permet d'avoir des "paquets" comme suit:

[32] [*] [5] [+] [b] [/] [c] [-] [sqrt] [(] [474] [)]

et ensuite, avec ces paquets, tu construits l'arbre de l'expression en tenant compte de la priorité des opérateurs:

             +-<sqrt >-(
             |         +-<474 >
      +-<- >-|
      |      |      +-<c >
      |      +-</ >-|
      |             +-<b >
-<+ >-|
      |      +-<5 >
      +-<* >-|
             +-<32 >

Il te reste "plus qu'à" bidouiller cet arbre. Genre quand tu vois une branche

             +-<sqrt >-(
             |         +-<4 >

tu remplaces par

             +-<2 >
             |

Là j'ai utilisé le parser d'ETP-Basic Compiler, que tu peux regarder aussi quand j'aurai publié les sources, en mettant #define _DEBUGARBRES dans verisyn.cpp

Tout ce qui passe pas par le port 80, c'est de la triche.

9

Le 15/09/2007 à 14:26

Ca y est c'est open-source now: http://code.google.com/p/etpbasiccompiler/
il faut avoir un client svn pour chopper le code, et tu regardes le fichier dont je t'ai parlé, dans: bool VeriSyn::VerifyExpression, je construit l'arbre a partir des tokens.

Tout ce qui passe pas par le port 80, c'est de la triche.

10

Le 15/09/2007 à 14:49

Enfin, je ne suis pas sûr que ton code (presque) sans commentaires, avec scanner et parseur bidouillés (pas de Flex ni Bison) soit vraiment le meilleur exemple pour lui apprendre.

Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

11

Le 15/09/2007 à 15:17

justement si, mon code est largement plus compréhensible que du code généré horrible par un outil générique.

Tout ce qui passe pas par le port 80, c'est de la triche.

12

Le 15/09/2007 à 15:38

On ne lit évidemment pas le code généré

, mais la description pour cet outil, qui est beaucoup plus lisible qu'un code maison.

13

Le 15/09/2007 à 15:46

mais par contre le résultat... ça ne vaut pas un parseur fait à la main ^^ (enfin *correctement* fait à la main, je n'ai pas regardé le code d'onur donc autant ne pas trop m'avancer ^^)

All right. Keep doing whatever it is you think you're doing.
------------------------------------------
Besoin d'aide sur le site ? Essayez par ici :)

14

Le 15/09/2007 à 15:48

Zephyr (./13) :
mais par contre le résultat... ça ne vaut pas un parseur fait à la main ^^ (enfin *correctement* fait à la main, je n'ai pas regardé le code d'onur donc autant ne pas trop m'avancer ^^)

entièrement d'accord

« The biggest civil liberty of all is not to be killed by a terrorist. » (Geoff Hoon, ministre des transports anglais)

15

Le 15/09/2007 à 16:01

Je pense que Flex et Bison sont utiles lorsqu'on n'arrive pas à faire le parseur à la main. Et donc, pour parser des expressions mathématiques, je n'en vois pas l'intérêt. (Le parseur de PrettyPrint est fait à la main, bien sûr

)

16

Le 15/09/2007 à 16:05

pour faire un lexer, antlr est vraiment sympa
my $0.02

http://rgaucher.info (blog:tech)
FuckTheSpam! ~ spam@fuckthespam.com

17

Le 15/09/2007 à 17:01

Non mais les troll de KK voilà quoi..
Mon parser n'est pas un bidouillage, il suffit de regarder. (c'est la version vb6 qui était du bidouillage)

Tout ce qui passe pas par le port 80, c'est de la triche.

18

Le 15/09/2007 à 17:14

mais qui était de la même qualité. Quand on prend la peine de faire une grammaire LL(1) on n'a pas besoin de yacc, et encore moins de flex quand on sait trouver les tokens à la main. C'est loin d'être du bidouillage.

1D86FN9
Nspire wiki
CONDUCTEUR Va-et-vient Des QUATRE MANCHE AVEC DES DIODES
La naissance de Boo en vrai

19

Le 15/09/2007 à 17:16

Je me souviens au projet compil, on avait utilisé lex et yacc justement (toi aussi squalyl je suppose), le truc était incapable de dire où était l'erreur de syntax (y) (à moins de réecrire la grammaire en LL1 justement je crois)

Tout ce qui passe pas par le port 80, c'est de la triche.

20

Le 15/09/2007 à 17:19

Bison est capable de te dire "syntax error before `foo'". Bien sûr, si ta ligne ressemble à foo+foo*foo-foo*foo foo-foo+foo, trouver l'erreur (les 2 foo qui se suivent) avec juste ça ne sera pas simple.

21

Le 15/09/2007 à 17:21

bison n'est pas capable de générer une grammaire parsable en regardant seulement un token a l'avance.

si tu arranges ta grammaire pour qu'elle le soit, alors il devient inutile d'utiliser bison.

1D86FN9
Nspire wiki
CONDUCTEUR Va-et-vient Des QUATRE MANCHE AVEC DES DIODES
La naissance de Boo en vrai

22

Le 15/09/2007 à 17:23

Non. Bison fait du LALR(1), les parseurs maison courants (recursive descent) font du LL(1). Le LALR(1) est plus puissant, en particulier il n'a pas le problème de la récurrence à gauche qui plante le parseur.

23

Le 15/09/2007 à 17:26

Enfin bon, le but c'est de lui expliquer comment on fait un truc de calcul symbolique, j'espere que c'est plus clair maintenant.

Tout ce qui passe pas par le port 80, c'est de la triche.

24

Le 15/09/2007 à 17:30

Une grammaire LL(1) peut être organisée de manière à se passer de la récurrence gauche

un analyseur LALR a besoin d'une pile de tokens, ce qui est inutile en LL(1)

on verra vite l'intéret quand il y aura un compilateur on calc. oui, ça c'est un vapor, mais quand elle se condensera, elle sera contente d'avoir un analyseur maison!

1D86FN9
Nspire wiki
CONDUCTEUR Va-et-vient Des QUATRE MANCHE AVEC DES DIODES
La naissance de Boo en vrai

25

Le 15/09/2007 à 17:31

KK.
C'est quand meme bien pratique Bison/Yacc. Le code genere est inchiable, y'a des warnings a la compil etc. mais pour parser une grammer relativement complexe, c'est tres bien.
Y'a aussi boost::spirit qui est bien

http://rgaucher.info (blog:tech)
FuckTheSpam! ~ spam@fuckthespam.com

26

Le 15/09/2007 à 17:36

Ceci dit, dans ce cas précis, on n'a pas une grammaire complexe, on a des expressions :s Donc je prefererais que le monsieur n'ait pas de warning dans tous les sens et qu'il comprenne ce qu'il fait. Maintenant s'il veut faire un compilo c++, on peut lui proposer les outils, oui.

Tout ce qui passe pas par le port 80, c'est de la triche.

27

Le 15/09/2007 à 17:45

nEUrOO (./25) :
Y'a aussi boost::spirit qui est bien

Beurk!

L'abus de l'operator overloading pour représenter l'EBNF en C++.

Il est beaucoup plus plus pratique d'avoir un vrai générateur.

28

Le 15/09/2007 à 17:51

onur (./26) :
Ceci dit, dans ce cas précis, on n'a pas une grammaire complexe, on a des expressions :s

J'ai déjà fait 2 parseurs d'expressions avec Yacc/Bison (légèrement différents parce que c'était pour 2 projets différents), ils étaient tous les deux plus simples et plus lisibles que ce que tu nous as pondu là (et je ne parle pas de ton tokéniseur

29

Le 15/09/2007 à 18:43

On n'a pas la même définition de "lisible" alors.

C'est quoi qui te dérange dans le tokéniseur? Ceci dit, le projet est open-source, tu peux porter tes améliorations plutôt que troller sans fondement.

Tout ce qui passe pas par le port 80, c'est de la triche.

30

Le 15/09/2007 à 18:50

Magical42 doit avoir le cerveau en train de bouillir ! ^^

la Nature nous montre seulement la queue du lion. Mais je suis certain que le lion a qui elle appartient pense qu'il ne peut pas se révéler en une fois en raison de son immense taille.

- Fondateur de Ti-Gen -: http://www.tigen.org

- Membre du Groupe Orage Studio -: http://oragestudio.free.fr/

- Mon site perso -: http://tisofts.free.fr

Projets TI68K en cours:
GFA-Basic = http://www.tigen.org/gfabasic
Arkanoid.
PolySnd 3.0.