30

Zeph: combien de recherche sur les moteurs prives par jour? smile
et 20 recherches sur combien de sessions de visiteurs?

31

aucune idée pour les deux questions, mais sans avoir le résultat pour la deuxième, je peux déjà répondre que ça ne change rien : 20 recherches/jour quel que soit le nombre de visiteurs ne rend pas ces recherches moins importantes ^^
avatar
All right. Keep doing whatever it is you think you're doing.
------------------------------------------
Besoin d'aide sur le site ? Essayez par ici :)

32

ca peut etre negligeable tongue

33

je parle pas du nombre en lui-même, je dis que quel que soit le nbr de visites à coté, il n'y a aucune raison de prétexter que tout à coup les 20 recherches n'ont finalement aucun intérêt. accessoirement, comme je trouve le principe de recherche via google complètement pourri, ça tombe bien ^^
avatar
All right. Keep doing whatever it is you think you're doing.
------------------------------------------
Besoin d'aide sur le site ? Essayez par ici :)

34

smile

35

j'ai eu un comportement bizarre...

J'ai recherché "schizophrénie" dans disc géné, jrad et cdg(search.php?skin=&s=4&ref=%2Fsujets.php%3Ff%3D1%26s%3D72)

-les résultats ne sont pas regroupés par topic (je pense que c'est du au classement par date)
-le troisième résultat, est indiqué ./23 , le lien pointe bien vers topics/99777-schizophrenie#22 mais le post correspondant est le #21

un "+1" en trop qq part peut être... (en tout cas le premier résultat devrait retourner post de départ ou ./1 et indique ./2 à la place)
avatar
Webmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca

36

Zalors ...

1- c'est normal pr le non regroupement, j'ai laissé le classement que me retourne le fulltext mysql
2- en effet il manquait un +1, bizarre que je n'ai pas remarqué ca + tot vu que le bug était présent sur tous les liens hum
avatar
Webmaster et développeur du site. Pour tout probleme ou question envoyez un mini message ou mail.

Suivez l'actualité de tous vos site préférés sur yAronews : http://ns.yaronet.com =)

37

2- comme indiqué irl : le fait de pouvoir lire le post directement dispense souvent d'aller sur le topic, c'est ptet pour ça...

autre demande : il serait possible que quand on tape "entrée" depuis la liste ça valide la recherche aussi ?
avatar
Webmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca

38

je trouve que la recherche sux...

1° on devrait pas avoir à préciser un forum
2° quand on oublie de préciser, ca ouvre une autre page et quand on revient on a plus le texte entré.. ergonomie = 0 (l'ajax pourrait etre sympa là, non?)

Franchement, avec ce qui se fait maintenant on sait qu'on peut faire des recherches sympa, là ca fait site de l'année 97 d'un mec qui a découvert le php.

Edit: Je confirme ce que je viens de dire. Je viens de voir qu'on peut choisir toutes les catégories, mais normalement quand on clique sur rien, ca recherche dans tout, cest le principe d'un filtre.
J'ai tapé "Jackson me suit" en ayant tout selectionné, ca me trouve rien. Et pourtant..
http://www.google.com/search?complete=1&hl=en&q=%22jackson+me+suit%22+yaronet&aq=null
ca cherche pas dans les titres?
Tout ce qui passe pas par le port 80, c'est de la triche.

39

Il me semble pas, et surtout je crois que ça ne cherche que dans des posts qui datent d'après l'installation du moteur de recherche. Sinon t'aurais pu formuler tes critiques de façon un peu plus correcte... ou alors code-le, le nouveau moteur.
avatar
All right. Keep doing whatever it is you think you're doing.
------------------------------------------
Besoin d'aide sur le site ? Essayez par ici :)

40

je veux bien le coder.
Tout ce qui passe pas par le port 80, c'est de la triche.

41

Ok pour le filtre sur les catégories.

Sinon pour info ca cherche effectivement pas dans les titres, et pour le moment que dans les posts de 2007 ... je n'ai pas trouvé de solution technique pour chercher dans plus de 650Mo de données de posts, si t'as une idée je suis preneur ^^

(pis en effet on peut formuler ses critiques de maniere plus agréable, j'ai plusieurs fois demandé de l'aide afin que l'on me donne des idées afin de coder ce moteur et j'ai rien eu, donc vala ...)
avatar
Webmaster et développeur du site. Pour tout probleme ou question envoyez un mini message ou mail.

Suivez l'actualité de tous vos site préférés sur yAronews : http://ns.yaronet.com =)

42

Ok désolé. J'avais pas suivi ce topic, j'ai mis ces critiques une fois après avoir utilisé le "moteur".

C'est quoi la contrainte en fait? Une limite de la taille de la base? Tu peux pas tout indexer c'est ca? Parce que moi j'ai envie de tout indexer à mort quite à ce que ca prenne beaucoup de place mais que ça soit super rapide et surtout super ergonomique.
Tout ce qui passe pas par le port 80, c'est de la triche.

43

Y'a une contrainte principale : je suis sur du mutualisé tongue

=> si tu rajoutes du fulltext sur tous les posts tu multiplies la taille de tables par 3 (index = 2x taille des données) => 1,8Go de données
=> mysql va commencer a ramer car il gere mal les tables trop grosses
=> infomaniak risquent de pas apprécier
=> l'index fulltext réduit considérablement les perfs d'insertion & de màj d'une donnée

moralité j'y gagne nulle part !

un moteur de recherche est tres simple à faire si on a peu de données ou qu'on peut faire ce que veut sur le serveur... là j'ai d'enormes contraintes et je dois faire avec ... donc si t'as une idée je suis preneur tongue

ah encore une chose ... le fulltext mysql n'indexe pas les mots <= 3 caracteres, pareil que le mien wink
avatar
Webmaster et développeur du site. Pour tout probleme ou question envoyez un mini message ou mail.

Suivez l'actualité de tous vos site préférés sur yAronews : http://ns.yaronet.com =)

44

discussion en message privé, donnez votre avis vous aussi svp

E R 14:39  onur » yAro: ok, je post, je vais dissimuler l'adresse de ffs 


R 14:39 yAro: aucun pb ^^ 


R 14:38 onur » yAro: à une chanson on associe pas juste un mot, déjà le titre c'est plusieurs mots et puis il y a tous les autres attributs, artist, album, genre, compositeur etc.. 

mais malgré ca je veux bien qu'il y ait une différence de taille mais vu qu'on indexe tout, ca varie en log(n) en principe. Donc avec 100 fois plus de données, l'utilisateur attendra peut etre 10 fois plus.. mais vu que c'est instantané dans le premier cas.. 

je te propose qu'on publie cette discussion dans le forum pour avoir le feedback/avis des autres, qu'en dis-tu? 


R 14:36 yAro: t'aurais pas le script qui indexe tout ca ? ca m'eviterait de perdre du tps à le recoder 


R 14:35 yAro: je sais utiliser les index myqsl merci    

et sinon t'as testé avec 200 000 chansons ... c'est bien ... sauf qu'un titre de chanson est de loin inférieur à la taille moyenne d'un post d'yN et de plus y'a 2 170 000 posts en base ... pas 200 000 ^^ 


R 14:31 onur » yAro: tu avais indexé au niveau sql les attributs? 

parce que justement dans la table 1, ce que je fais, je mets 10 attributs lettre1, lettre2, lettre3 etc.. et je les indexe aussi. J'indexe pas en fulltext quoi. Et si tu indexes pas du tout la table 2, ca sert strictement à rien ce systeme. 

La requete n'est pas inchiable du tout, le php te le crache instantanément, regarde ca: (cest ultra secret ce lien) 

http://************************ 

ya que 3 chanson là dans la base, mais j'ai testé avec 200000 chansons et cest instantané! je te montre ce lien pour te montrer que ca construit la requete sql comme il faut assez rapidement. 

actuellement dans spool, cest du fulltext, et ca sux méchamment je trouve. 


R 14:27 yAro: bah si tu veux jpeux te fiare une démo, ca me coute rien, tu verras que les temps de recherche sont enormes avec ce systeme, c'est le premier que j'ai mis en place sur yN et c'est à cause de ca que je l'ai viré 


R 14:25 onur » yAro: ca marche très bien je t'assure, on va l'intégrer à la nouvelle version de spool (http://spool.fm) où il y aura des millions de titres. 

le numéro de sujet c'est pas un souci, t'as pas besoin de l'indexer celui là si tu indexes les autres attributs critiques. 

Bien sur qu'il faut que la table d'asso ait beaucoup de ligne, y a pas de miracle.. c'est à toi de voir. 


R 14:21 yAro: ok on est bien d'accord alors    

ton systeme c'est celui de phpbb en fait    

ensuite moi me faut le numéro de sujet encore pour retrouver le post, 

et cette solution n'est absolument pas réalisable sur yN ... la table d'assoc aurait bcp trop de lignes .... 

de plus avec ton systeme je on cherche 2 mots, ca fait grosso modo 2 requetes avec un "OR" entre les 2 .... et là si t'arrives à avoir une réponse avant le timeout php chapo    


R 14:19 onur » yAro: table1:keywords 

id | mot 
----------------- 
1 | test 


table2: assoc 

worid | postid | forumid 
--------------------------- 
1 | 2 | 2 
1 | 2 | 3 
1 | 5 | 1 

le tuple (wordid, postid, forumid) doit etre unique. Tu indexes le tout, pour la table 2 --> pas trop de cout, ces des valeurs numériques. Pour la table 1 --> pas trop de cout, s'il y a peu de mots différents dans le forum. 


R 14:15 yAro: c'est un des premiers trucs que j'ai mis en place jte dis ^^ 

pour être sûr .... c'est à un truc comme ca que tu penses ? 

mot | forum | sujet | post 
--------------------------- 
"test" | 1 | 2 | 3 
"test" | 1 | 3 | 4 
"test" | 2 | 5 | 1 




R 14:11 onur » yAro: francehement sans faire de hash, je pense qu'on peut s'en sortir. Vu que cest toujours les memes mots qui reviennent dans un forum, la table qui va surtout se remplir cest celle de l'association (et pour le forum choisi tu peux ajouter un attribut à l'association et faire des associations en plus au besoin), et donc ca prendrait pas de place. 


R 14:07 yAro: c'est pas vraiment précisé, le pb c'est qu'ils te préviennent jamais à l'avance quand c'est trop, mais ils élaguent    

mais par expérience une table > 200Mo commence a pas mal ramer en insert/update avec du fulltxt 


R 14:06 onur » yAro: on a le droit à combien de MO ? 


R 14:04 yAro: j'ai déjà testé une technique comme ca : 

hashcode entier du mot => postX, postY, postZ 

Le pb apres c'est que ca prend plus de place au final et si tu cherches pas le mot exact bah tu trouvera rien ... 

De plus si tu fais une relation mot => posts, comment tu geres les différents forums (un mot apparaissant dans le forum ti ne doit pas être trouvé sur le forum pockett par ex) ? il faudrait dupliquer ce systeme pour chaque forum du coup => encore plus de place 

actuellement j'ai des tables fulltext "élaguées", je filtre tous les posts par rapport à des mots communs, trop petits, caracteres spéciaux et autre afin de n'indexer que le strict nécessaire ... et rien que ca sur l'année 2007 me prend deja 105Mo    


R 13:57 onur » yAro: moi je fais un moteur de recherche qui prend pas mal de place mais j'utilise pas fulltext en fait, je gere les index à la main. 

J'ai une table avec les mots clés, et j'associe à chaque mot clé, les éléments (ici ca va etre les posts) qui contiennent ce mot clé. La table avec les mots clés est pas indexé sur le string, mais sur 10 attributs entiers qui sont les valeurs décimales des 10 premiers caractères unicodes. J'indexe ces 10 attributs. Résultat: cest fucking rapide. Apres au niveau place, ca doit dépendre des données, mais je pense que dans le cadre d'un forum, y a pas mal de mots qui reviennent souvent. Donc à voir. 

Tu fais comment actuellement? 

Tout ce qui passe pas par le port 80, c'est de la triche.

45

46

tututudodolu gnugnugnugniarkgniark....
avatar
la Nature nous montre seulement la queue du lion. Mais je suis certain que le lion a qui elle appartient pense qu'il ne peut pas se révéler en une fois en raison de son immense taille.

- Fondateur de Ti-Gen -: http://www.tigen.org

- Membre du Groupe Orage Studio -: http://oragestudio.free.fr/

- Mon site perso -: http://tisofts.free.fr

Projets TI68K en cours:
GFA-Basic = http://www.tigen.org/gfabasic
Arkanoid.
PolySnd 3.0.

47

mais encore ?
avatar
All right. Keep doing whatever it is you think you're doing.
------------------------------------------
Besoin d'aide sur le site ? Essayez par ici :)

48

Sinon, [google]tag site:yaronet.com[/google] ça ne vous va pas (pour les cas où le moteur actuel de yN n'est pas pratique) ?
avatar
« Quand le dernier arbre sera abattu, la dernière rivière empoisonnée, le dernier poisson capturé, alors vous découvrirez que l'argent ne se mange pas. »

49

Ca leur va pas a cause de la recherche dans les forums prives

50

Alors? Ca en est où?
On aura une fonction de recherche avant 2010 sur yN?
Tout ce qui passe pas par le port 80, c'est de la triche.

51

./39, deuxième phrase... c'est fou ça, t'as apporté quoi à yN pour te permettre de râler quand les fonctionnalités que tu veux manquent ?
avatar
All right. Keep doing whatever it is you think you're doing.
------------------------------------------
Besoin d'aide sur le site ? Essayez par ici :)

52

j'ai proposé mon aide... mais monsieur a trop d'orgueil. Alors, pour le bien des gens qui utilisent yN dont je fais partie, ou il code ca ou il laisse faire les pros.
Tout ce qui passe pas par le port 80, c'est de la triche.

53

D'après la description qu'on m'en a faite, la solution du "pro" aurait couté je ne sais combien de 100aines de mo à la base, et c'est pas franchement quelque chose de souhaitable (pour rappel, yN est sur un hébergement mutualisé, avec les contraintes qui vont avec).

Enfin bon coté orgueil, tu m'as l'air assez bien positionné toi aussi... pourquoi ne pas te faire ton propre forum avec un super moteur de recherche, si tu as tellement de talent et qu'on ne veut pas accepter tes idées géniales ?
avatar
All right. Keep doing whatever it is you think you're doing.
------------------------------------------
Besoin d'aide sur le site ? Essayez par ici :)

54

Tu ne m'as pas compris...

Je vais t'expliquer. Le forum est super. Tout est bien. Tout me convient... sauf la recherche (c'est pourquoi je fais une fixation là-dessus), et je propose mon aide, je ne peux pas faire plus honnete et plus coopératif. Ma solution ne coute pas plus cher, c'est juste que yaro veut que ca fasse aussi un "OU" quand on entre plusieurs mots, ce qui pourrit directement ma solution mais aussi la sienne d'ailleurs, alors que ce n'est pas utile quand on tape plusieurs mots c'est qu'on les veut tous.

donc :

conseil : relis la discussion entre yaro et moi.
indice : ./45
Tout ce qui passe pas par le port 80, c'est de la triche.

55

Juste pour info, il m'en a un peu parlé de ta solution, et même si je ne me souviens plus des détails les problèmes allaient plus loin qu'une simple histoire de "ou" et l'impression que j'en ai gardée au final c'est "son système ne sera jamais implémenté sur yN, du moins pas sans grosses modifications".

Et c'est très bien que le forum te convienne, et encore mieux que tu aies proposé une solution d'amélioration. Il se trouve juste qu'elle a été refusée, et qu'à mon avis c'est pas uniquement pour un problème d'orgueil...
avatar
All right. Keep doing whatever it is you think you're doing.
------------------------------------------
Besoin d'aide sur le site ? Essayez par ici :)

56

Je te laisse toi et les autres lecteurs du forum en juger par eux-mêmes.

Et c'est bien dommage car pour moi, la recherche actuelle est équivalente à http://tigen.org/forum/find.php
Tout ce qui passe pas par le port 80, c'est de la triche.

57

[edit] rien à ajouter en fait embarrassed
avatar
All right. Keep doing whatever it is you think you're doing.
------------------------------------------
Besoin d'aide sur le site ? Essayez par ici :)

58

pour avoir été présent lors du recueil des propos, on a même estimé à la louche ce que ça représentait... et une feature qui prends plus de deux fois la taille actuelle de la base, c'est pas cool...
avatar
Webmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca

59

Moi y'a un truc que je comprends, pas, c'est pourquoi yaro reste sur de l'hébergement mutualisé et doit se faire chi** avec des contraintes à la con, alors que les serveurs dédiés ne coûtent quasiment pas plus cher aujourd'hui (dedibox, kimsufi ou même 1and1) et sont vraiment tout à fait adaptés à l'utilisation que pourrait en faire yN...
Surtout que yaro devrait gagner suffisament pour amortir le prix avec les quelques pub du site, et puis 20~30 euros par mois c'est vraiment pas la mort.

Bref, quand on veut faire un site efficace et se faire plaisir, faut s'en donner les moyens quoi.

60

Il ne doit plus être accessible mais à un moment (avant infomaniak en fait) l'idée d'un dédié avait été lancée...

et puis force a été de constater que l'amortissement des soit disantes bonne volonté aurait été suffisant 3 mois et après basta...
avatar
Webmaster du site Ti-FRv3 (et aussi de DevLynx)
Si moins de monde enculait le système, alors celui ci aurait plus de mal à nous sortir de si grosses merdes !
"L'erreur humaine est humaine"©Nil (2006) // topics/6238-moved-jamais-jaurais-pense-faire-ca