1

Est-ce qu'il y en a qui s'y connaissent en data mining? Car je me demande un truc.

Sur un site, je log toutes les erreurs qui se produisent. Les sources d'erreur sont du genre : paramètre manquant dans la requete post, exception dans le code (requete sql qui échoue ou variable non déclarée etc..). Quand je log une erreur, je note tout sur la requete http et la trace de l'exception qui vient de se produire: de l'user-agent à l'ip en passant par le nom du navigateur du mec, etc.

C'est vraiment pas mal comme méthode, ça permet d'etre au courant pour corriger rapidement les erreurs qu'on n'a pas vu parce qu'on avait pas la configuration de l'utilisateur par exemple.

Ma question est simple. Est-ce qu'il y a moyen de donner ça à une blackbox qui puisse sortir des faits du genre "Navigateur==IE implique exception ligne 62 dans moncode.txt", càd qui voit des relations de cause à effet dans ces logs d'erreur.

J'ai trouvé quelques présentations sur le net, mais rien de concret. Si quelqu'un s'y connait, j'aimerais connaitre les outils qui permettent de faire ça et la façon de les paramétrer.
Tout ce qui passe pas par le port 80, c'est de la triche.

2

grep grin
avatar
Il n'a pas de mots
Décrire son mépris
Perdre les rênes
Il a perdu la foi

3

Edited_3669

4

Le logiciel R devrait permettre de faire tout ça: http://www.r-project.org/ (open source)

Par contre il va falloir s'y plonger un peu, c'est pas vraiment le truc qui va te sortir nativement une solution; mais une simple classification devrait suffire pour ce genre de problème.

5

Ok j'ai beaucoup de questions:

J'ai trouvé un tuto de datamining avec R. Je vois que R peut faire des prédictions pour la suite mais il peut aussi sortir des propriétés du style A en entrée => B en sortie? Dans le datamining, j'ai l'impression qu'il y a pas d'entrée ou sortie y a juste un ensemble de données, je me trompe? Dans ce cas, faut-il que je m'oriente vers les réseaux de neuronnes? Si oui, il faut que je prenne des modèles à une couche car sinon on sait pas interpréter les valeurs des poids des neuronnes cachées?
Tout ce qui passe pas par le port 80, c'est de la triche.

6

Ben disons qu'un tableau croisé dynamique dans excel répondrait à ta demande de base.

Mais R permet de gérer des réseaux de neurones, ou il y a une variable de sortie.

7

c'est carrément de l'intelligence artificielle de sortir des implications de ce genre à partir de données brutes, non?

8

Dans le cas de ce que veux faire Onur non pas du tout.

Sur le data-mining en général je ne sais pas, ça applique toujours un algo que tu pourrais faire à la main ... mais je ne sais pas ou se situe la limite avec l'IA.

Un réseau de neurone c'est considéré comme de l'IA ?