Alors j'avais vraiment rien à foutre sur internet , et je me suis amusé à comparer les resultats des differents moteurs de recherches pour des noms de moteurs de recherches... Ok je me suis mal éxprimé, en gros j'ai cherché le mot " google" dans yahoo , msn et google. Puis j'ai fait de meme pour yahoo msn .
Resultats assez surprenants:
Dans le moteur de recherche google
1-google 2 520 000 000
2-yahoo 1 740 000 000
3-msn 721 000 000
Dans le moteur de recherche yahoo
1-yahoo 721 000 000
2-google 374 000 000
3-msn 176 000 000
dnas le moteur de recherche msn
1-yahoo 95 002 540
2-google 62 068 817
3-msn 60 203 692
bizarre??
On the last day I took her where the wild roses grow
She lay on the bank, the wind light as a thief
And I kissed her goodbye, said "All beauty must die"
And I lent down and planted a rose between her teeth
bizarre ?? Vous avez dit bizarre ?! Comme c'est bizarre...

Ad impossibilia nemo tenetur
Jyaif Le 06/07/2006 à 19:27 Moi j'ai fais qlq test et j'ai pas du tout les même nombres que toi.
encore un autre truc louche...
On the last day I took her where the wild roses grow
She lay on the bank, the wind light as a thief
And I kissed her goodbye, said "All beauty must die"
And I lent down and planted a rose between her teeth
Google est un crawler ayant pour mots clefs les mots dans les pages et c'est le plus ancien des trois dans ce domaine
Yahoo a ma connaissance n'est toujours pas un crawler, mais un site utilisant les références qui lui sont enregistré et/ou utilise les keywords pas les mots présents dans les pages. Et meme si yahoo etait devenu un crawler ça fait vraiment pas longtemps et je serait etoné si il ont les moyens de google au niveau informatique.
MSN a normalement copié le fonctionnement de google (donc un crawler répertoriant sur les mots des pages) mais MSN est présent depuis pas longtemps. MSN est hyper censuré et reste (malgres tout) microsoft ensuite meme si c'est microsoft qui est derriere, je suis loin d'etre sur que ce qui tourne au niveau machine pour l'indexation soit au meme niveau que ce propose google, a savoir que google utilise du pc de base en cluster pour faire le crawling (le GoogleDance comme c'est appelé)

Proud to be CAKE©®™
GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.
hibou Le 09/07/2006 à 19:21 Petite précision : le google dance c'est pour dispatcher l'index calculé. Le cluster de PC qui lui fait le calcul, utilise du MapReduce, principe qui permet de faire du calcul massivement parallele sur un système de fichier distribué. cf les papers de google labs, et aussi Lucene-hadoop de Apache.
A propos de stats, sur mon site, MSN crawl au mois deux fois plus que le google bot, et le yahoo slurp est pas si loin derrière. Et l'ancienneté de Google fait que c'est le plus utilisé, quand à savoir si c'est le plus pertinent... je demande à voir.
Ok, donc yahoo a changé de méthode, enfin ça fait pas super longtemps donc.

Proud to be CAKE©®™
GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.
Il faut voir aussi que les mots choisis par le gars qui a fait l'article ne sont pas pertinents (en tous cas pas pour google).
Faudrait que je retrouve mon cours de DEA sur les moteurs de recherche, je me souviens plus des détails mais en gros la conclusion c'était que les algorithmes utilisés par Google (du moins ceux connus) ne sont pas conçus pour rechercher les mots très utilisés et/ou très cours. D'où les résultats incohérents.