pour les algos de tokenisation de texte, en voila un il est simple et limité il ne gere pas les commentaires multilignes et il est en java (made in moi, peut etre a revoir, mais bon... il est deja vraiment performant: un texte de 2 mo est tokenizé en 20 secondes):
Pour les commentauire multilignes qui ne sont pas encore géré, c'est rien je l'ai deja fait en C# qui fonctionne mais en C# les arraylists sont mal gérés donc il est moins performant, c'est pour ca que je l'ai porté en java, donc il faut encore attendre pour avoir l'algo entier... il est facilement modifiable...
en ce qui concerne l'ago il y a 2 choses: les mots clés: gérés avec la classe vector c'est le mieux.
pour les fonction il faut utiliser les hashtables, si le nombre de fontions repertoriées est trop important le type d'analyse ne devient plus valide et la durée augmente avec le nombre de comparaisons a faire.
--- je remettrais le script en php ---
[edit]Edité par freka le 28-02-2002 à 12:01:13[/edit]