robinHoodLe 30/03/2011 à 20:32

ha oui, le premier bit en utf8 est toujours 1, l'ascii résoudrais mon problème ^^
mais je l'aimais bien mon § en plus son nom utf 8 étais "section", ca poutrait ^^
maintenant quel char est assez non utilisé pour être utilisé ? le $ c'est mort à cause de jquery, les { } ou [ ] pareil ...

bon, j'ai décidé de tester TOUS les char utf8, j'en suis au quart la

for($n=0;$n<=65535;$n++)
{	$start = $n<<16;
	$end = ($n+1)<<16;
	print '<br>['.$start.'] to ['.$end.'] ';

	ob_end_flush();ob_flush();flush();ob_start();
	$buf = '';$tstart = microtime(true);

	for($c=$start;$c<$end;$c++) $buf .= iconv('UCS-4LE', 'UTF-8//IGNORE', pack('V', $c));

	$found = strpos($buf,'§');
	if($found !== false)
	{	print '<b style="color:red;">found !</b> ';
		
		$offset = $found;
		while($f = strpos($buf,'§',$offset))
		{	if($f > 15) $sub = substr($buf,$f-10,20); else $sub = substr($buf,$f,20);
			$sub = str_replace('§','<span style="color:green;">§</span>',$sub);
			print '<span style="color:red;">"</span>'.$sub.'<span style="color:red;">"</span> ';
			$offset = $f+1;
		}
	}	else	print '<b style="color:green;">OK</b> ';

	print round((microtime(true)-$tstart),1).'s';
}

edit > ca c'est bizarrement stoppé au char 2138636288 mais jusqu'à présent aucun faux positifs

Si tu voulais faire un truc rapide, fallait déjà pas choisir PHP

bah je m'étais un intéressé à ruby, mais il à pas l'air tellement plus rapide, et puis si je doit tout réapprendre, je suis pas près de gagner 4 ronds :/
après se démerder de faire un truc rapide avec un truc lent c'est cool, c'est comme pour le ti basic et limmt qui avais fait "red hat" sur la 89

par contre, personne à fait de flib ou vertel version php ? :/

enfin bon, si php est le basic des langages web, je suis pas contre me faire indiquer l'équivalent du C