1

Alors j'avais vraiment rien à foutre sur internet , et je me suis amusé à comparer les resultats des differents moteurs de recherches pour des noms de moteurs de recherches... Ok je me suis mal éxprimé, en gros j'ai cherché le mot " google" dans yahoo , msn et google. Puis j'ai fait de meme pour yahoo msn .

Resultats assez surprenants:

Dans le moteur de recherche google
1-google 2 520 000 000
2-yahoo 1 740 000 000
3-msn 721 000 000

Dans le moteur de recherche yahoo
1-yahoo 721 000 000
2-google 374 000 000
3-msn 176 000 000

dnas le moteur de recherche msn
1-yahoo 95 002 540
2-google 62 068 817
3-msn 60 203 692

bizarre??
On the last day I took her where the wild roses grow
She lay on the bank, the wind light as a thief
And I kissed her goodbye, said "All beauty must die"
And I lent down and planted a rose between her teeth

2

bizarre ?? Vous avez dit bizarre ?! Comme c'est bizarre...
avatar
Ad impossibilia nemo tenetur

3

Moi j'ai fais qlq test et j'ai pas du tout les même nombres que toi.

4

encore un autre truc louche...
On the last day I took her where the wild roses grow
She lay on the bank, the wind light as a thief
And I kissed her goodbye, said "All beauty must die"
And I lent down and planted a rose between her teeth

5

Les droits inaliénables du troll :
1) le droit d'avoir raison
2) le droit d'être péremptoire
3) le droit de ne pas lire
4) le droit de ne pas répondre
5) le droit d'être de mauvaise foi
6) Autant pour moi / Faignant / Vivent Tintin et Milou

6

[oops, mauvais topic]

« The biggest civil liberty of all is not to be killed by a terrorist. » (Geoff Hoon, ministre des transports anglais)

7

Hum,google, je sais pas s'ils evaluent pas ton profil (preferences) a chaque recherche... ca pourait biaiser si c'est le cas roll

8

Lien intéressant Hippo oui
avatar
« Nous avons propagé sur Extranet une histoire fabriquée de toutes pièces selon laquelle une certaine disposition d'étoiles, vue depuis la planète d'origine des butariens, formaient le visage d'une déesse galarienne.
Sans chercher à vérifier ces informations, certains ont décrété que c'était la preuve de l'existence de la déesse. Ceux qui notaient le manque de preuves se faisaient attaquer. »

Legion, geth trolleur à portée galactique

9

samgate :
Alors j'avais vraiment rien à foutre sur internet , et je me suis amusé à comparer les resultats des differents moteurs de recherches pour des noms de moteurs de recherches... Ok je me suis mal éxprimé, en gros j'ai cherché le mot " google" dans yahoo , msn et google. Puis j'ai fait de meme pour yahoo msn .

Resultats assez surprenants:

Dans le moteur de recherche google
1-google 2 520 000 000
2-yahoo 1 740 000 000
3-msn 721 000 000

Dans le moteur de recherche yahoo
1-yahoo 721 000 000
2-google 374 000 000
3-msn 176 000 000

dnas le moteur de recherche msn
1-yahoo 95 002 540
2-google 62 068 817
3-msn 60 203 692

bizarre??

Renseigne toi sur la façon dont marche chacun de ses moteurs de recherche et tu comprendras pourquoi.
avatar
Proud to be CAKE©®™


GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.

10

mézencor ?
avatar
<<< Kernel Extremis©®™ >>> et Inventeur de la différence administratif/judiciaire ! (©Yoshi Noir)

<Vertyos> un poil plus mais elle suce bien quand même la mienne ^^
<Sabrina`> tinkiete flan c juste qu'ils sont jaloux que je te trouve aussi appétissant

11

Flanker :
mézencor ?

Ca s'appelle le "je sais tout mais j'ai la flemme" tongue
avatar
« Nous avons propagé sur Extranet une histoire fabriquée de toutes pièces selon laquelle une certaine disposition d'étoiles, vue depuis la planète d'origine des butariens, formaient le visage d'une déesse galarienne.
Sans chercher à vérifier ces informations, certains ont décrété que c'était la preuve de l'existence de la déesse. Ceux qui notaient le manque de preuves se faisaient attaquer. »

Legion, geth trolleur à portée galactique

12

Google est un crawler ayant pour mots clefs les mots dans les pages et c'est le plus ancien des trois dans ce domaine

Yahoo a ma connaissance n'est toujours pas un crawler, mais un site utilisant les références qui lui sont enregistré et/ou utilise les keywords pas les mots présents dans les pages. Et meme si yahoo etait devenu un crawler ça fait vraiment pas longtemps et je serait etoné si il ont les moyens de google au niveau informatique.

MSN a normalement copié le fonctionnement de google (donc un crawler répertoriant sur les mots des pages) mais MSN est présent depuis pas longtemps. MSN est hyper censuré et reste (malgres tout) microsoft ensuite meme si c'est microsoft qui est derriere, je suis loin d'etre sur que ce qui tourne au niveau machine pour l'indexation soit au meme niveau que ce propose google, a savoir que google utilise du pc de base en cluster pour faire le crawling (le GoogleDance comme c'est appelé)
avatar
Proud to be CAKE©®™


GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.

13

Petite précision : le google dance c'est pour dispatcher l'index calculé. Le cluster de PC qui lui fait le calcul, utilise du MapReduce, principe qui permet de faire du calcul massivement parallele sur un système de fichier distribué. cf les papers de google labs, et aussi Lucene-hadoop de Apache.

A propos de stats, sur mon site, MSN crawl au mois deux fois plus que le google bot, et le yahoo slurp est pas si loin derrière. Et l'ancienneté de Google fait que c'est le plus utilisé, quand à savoir si c'est le plus pertinent... je demande à voir.

14

Godzil :
Yahoo a ma connaissance n'est toujours pas un crawler, mais un site utilisant les références qui lui sont enregistré et/ou utilise les keywords pas les mots présents dans les pages. Et meme si yahoo etait devenu un crawler ça fait vraiment pas longtemps et je serait etoné si il ont les moyens de google au niveau informatique.

Sisi, yahoo utilise des crawlers. Ils sont sur ces plages IP :
68.142.192.0/18 202.160.176.0/20
Et ils sont meme plutot actif, ils me pourrissent bien mes logs apache...
Mon site perso : http://www.xwing.info

15

Ok, donc yahoo a changé de méthode, enfin ça fait pas super longtemps donc.
avatar
Proud to be CAKE©®™


GCC4TI importe qui a problème en Autriche, pour l'UE plus et une encore de correspours nucléaire, ce n'est pas ytre d'instérier. L'état très même contraire, toujours reconstruire un pouvoir une choyer d'aucrée de compris le plus mite de genre, ce n'est pas moins)
Stalin est l'élection de la langie.

16

Il faut voir aussi que les mots choisis par le gars qui a fait l'article ne sont pas pertinents (en tous cas pas pour google).
Faudrait que je retrouve mon cours de DEA sur les moteurs de recherche, je me souviens plus des détails mais en gros la conclusion c'était que les algorithmes utilisés par Google (du moins ceux connus) ne sont pas conçus pour rechercher les mots très utilisés et/ou très cours. D'où les résultats incohérents.

17

Godzil :
Ok, donc yahoo a changé de méthode, enfin ça fait pas super longtemps donc.

je dirais au moins un an
avatar
I'm on a boat motherfucker, don't you ever forget

18

A propos de Yahoo, il viennent d'embaucher Doug Cutting, qui travaillait apparement dèjà depuis pas mal de temps contractuellement pour eux :
I'm now a "Yahoo!".
On the first of this year, after four years as an independent contractor, I accepted a full-time job with Yahoo!. This isn't as big of a change as it sounds. For much of the past four years my work on Nutch had been in-part funded by Yahoo! (and Overture before they were acquired by Yahoo!). I'm still primarily working from home, and, so far, entirely working on open-source stuff: Lucene, Hadoop and Nutch. The biggest change is that I don't have to draft contracts, submit invoices, etc. I can now instead better focus on the technology and the open-source process.

19

Moumou
:
Godzil :
Ok, donc yahoo a changé de méthode, enfin ça fait pas super longtemps donc.

je dirais au moins un an


En fait même deux ans et demi, cf wikipedia :
February 19, 2004: Yahoo! drops Google-powered results, launching its own web-crawling algorithm and using its own site index after it had used Google's results for a long time. March 2004: Yahoo! launches its own search engine technology.


Je pense qu'on peut clairement dire que ça fait plus que « y a pas longtemps » ^^
avatar
I'm on a boat motherfucker, don't you ever forget