wp-kit-cn中一个性能问题的调优
这几天被wp-kit-cn(中文工具箱,wordpress插件)的一个内存溢出问题搞得满头头皮屑……在处理大文本的时候,它原有的计算字数的算法会占用巨大的内存,基本上超过5万汉字就不用期待能够给我返回一个正确的结果。在这个插件中,它使用正则匹配的方式来取得一段文字的实际长度,代码如下:
Language: PHP
return preg_match_all(‘%(?:
[\x09\x0A\x0D\x20-\x7E] # ASCII
| [\xC2-\xDF][\x80-\xBF] # non-overlong [......]

