指穷于为薪,火传也,不知其尽也。—《养生主》

Daily English:He who makes no mistakes makes nothing.

标记为 ‘正则’ 的归档

wp-kit-cn中一个性能问题的调优

这几天被wp-kit-cn(中文工具箱,wordpress插件)的一个内存溢出问题搞得满头头皮屑……在处理大文本的时候,它原有的计算字数的算法会占用巨大的内存,基本上超过5万汉字就不用期待能够给我返回一个正确的结果。在这个插件中,它使用正则匹配的方式来取得一段文字的实际长度,代码如下:

Language:  PHP

return preg_match_all(‘%(?:
[\x09\x0A\x0D\x20-\x7E] # ASCII
| [\xC2-\xDF][\x80-\xBF] # non-overlong [......]

继续阅读

支持正则表达式的编辑器:SED

今天有一个朋友让我帮他写一个正则表达式,来把网站日志中带有php的行挑出来。

原以为是在php或js下实现,我满口答应,可他说不是,是在ultraeditor下做这事情。额的神哪,ultraeditor的正则表达式是公认的烂,用它的正则怎么可能找到东西?又问了一下,嗯,他那还有editplus,好吧,ep支持的正则比ue好多了,我研究研究去。

几分钟下来,我发现我错了……把日志中带有php的行找到没问题,问题是如何挑出来?好吧,换个思路,如何找到不含有php的行?我把ep的帮助文件翻来覆去的看,关于正则,总共就短短的几段话,里面关于反向的部分一句没有。那我该怎么办?

没办法,上网去找找有没什么[......]

继续阅读

Tag Cloud