squalyl (./3917) :Faut que je creuse le parser SAX pour PHP, du coup (mais je dois gérer le stream côté client en JS et côté serveur en PHP, avec une exécution asynchrone de scripts... pas infaisable, mais je sens les limites du PHP).
J'arrive a interpréter a la volée les 14 Go compressés BZ2 du dump de wikipédia "en" pour en extraire les articles, le tout en python, avec un stream bz2 et des évènements SAX...