1

Oui, "rare event detection" mais pas au sens où on l'entend, car ce que je trouve sur le net avec ces mots clés ne correspond pas au cas d'utilisation que je voudrais en faire.

Imaginons N utilisateurs, qui choisissent des nombres aléatoires entre 1 et 10000 de façon journalière. Puis, un des users se met à choisir souvent des nombres entre 50 et 60 pendant plusieurs jours.
Je voudrais détecter cet évenement.

Je voudrais en savoir plus sur ce genre de choses: si vous avez des éléments purement mathématiques ou purement implémentation: tout me va, sachant que si on navigue du coté datamining & co, j'aurai pas le temps de m'y plonger, alors qu'une proposition purement programmation/implémentation me conviendrait tout aussi bien: il s'agit d'un site web où on voudrait détecter des comportements rares des utilisateurs réguliers (genre un user de yN qui ne va jamais au forum cuisine et qui commence à y aller). Donc une solution avec des tables, des compteurs dans les tables, et des crons qui tournent chaque jour me va très bien aussi: encore faut-il que je sache ce que doivent faire ces crons.

Des idées?
Tout ce qui passe pas par le port 80, c'est de la triche.

2

onur (./1) :
genre un user de yN qui ne va jamais au forum cuisine et qui commence à y aller
Tu dois pouvoir faire ça avec des techniques d'apprentissage, genre réseaux neuronaux & compagnie, grossièrement tu mets à jour des probabilités en fonction de tes observations.

avatar
Combien de tas de bois une marmotte pourrait couper si une marmotte pouvait couper du bois ?

3

Big Brother is watching you? roll
avatar
Mes news pour calculatrices TI: Ti-Gen
Mes projets PC pour calculatrices TI: TIGCC, CalcForge (CalcForgeLP, Emu-TIGCC)
Mes chans IRC: #tigcc et #inspired sur irc.freequest.net (UTF-8)

Liberté, Égalité, Fraternité

4

tout de suite les grands mots. C'est du data mining, stoo embarrassed
avatar
Il n'a pas de mots
Décrire son mépris
Perdre les rênes
Il a perdu la foi

5

Je me rappelle que certains algorithmes de compression permettent de détecter des comportements anormaux/rare. Notre prof nous en avait parler en cours de codage et compression en évoquant en exemple le BlockSorting. C'est très utilisée pour les logs. Genre tu comprimes les log des utilisateurs chaque jour et avec la taille du fichier tu vois si il s'écarte trop de la moyenne. Ensuite il y a des méthodes pour retrouver l'anomalie. Comme çà il avait detecter qu'un élève de la classe arrivait souvent en retard en Tp ;-).

Tu devrais rechercher plutot avec ces mot clés Compression- Détection Anomalies...


Ps : Ca faisait longtemps que j'avais pas posté. En parcourant le forum je vois que la communauté est toujours présente (Pollux, Onur, Ethaniel et ses pavés;-), ...)

6

./1 : ca me fait penser au Complex Event Processing ton truc. C'est typiquement utilisé pour la détection de fraudes banquaires non évidentes. J'ai des collègues qui travaillent là-dessus mais j'en connais pas beaucoup sur le sujet.
Côté Open Source les outils les plus connus sont Esper et NEsper.

7

Wow pas mal, merci wink
Tout ce qui passe pas par le port 80, c'est de la triche.