ha oui, le premier bit en utf8 est toujours 1, l'ascii résoudrais mon problème ^^
mais je l'aimais bien mon § en plus son nom utf 8 étais "section", ca poutrait ^^
maintenant quel char est assez non utilisé pour être utilisé ? le $ c'est mort à cause de jquery, les { } ou [ ] pareil ...
bon, j'ai décidé de tester TOUS les char utf8, j'en suis au quart la
for($n=0;$n<=65535;$n++)
{ $start = $n<<16;
$end = ($n+1)<<16;
print '<br>['.$start.'] to ['.$end.'] ';
ob_end_flush();ob_flush();flush();ob_start();
$buf = '';$tstart = microtime(true);
for($c=$start;$c<$end;$c++) $buf .= iconv('UCS-4LE', 'UTF-8//IGNORE', pack('V', $c));
$found = strpos($buf,'§');
if($found !== false)
{ print '<b style="color:red;">found !</b> ';
$offset = $found;
while($f = strpos($buf,'§',$offset))
{ if($f > 15) $sub = substr($buf,$f-10,20); else $sub = substr($buf,$f,20);
$sub = str_replace('§','<span style="color:green;">§</span>',$sub);
print '<span style="color:red;">"</span>'.$sub.'<span style="color:red;">"</span> ';
$offset = $f+1;
}
} else print '<b style="color:green;">OK</b> ';
print round((microtime(true)-$tstart),1).'s';
}
edit > ca c'est bizarrement stoppé au char 2138636288 mais jusqu'à présent aucun faux positifs
Si tu voulais faire un truc rapide, fallait déjà pas choisir PHP 
bah je m'étais un intéressé à ruby, mais il à pas l'air tellement plus rapide, et puis si je doit tout réapprendre, je suis pas près de gagner 4 ronds :/
après se démerder de faire un truc rapide avec un truc lent c'est cool, c'est comme pour le ti basic et limmt qui avais fait "red hat" sur la 89
par contre, personne à fait de flib ou vertel version php ? :/
enfin bon, si php est le basic des langages web, je suis pas contre me faire indiquer l'équivalent du C
