人就个人而言终有一死,就整体而言则是不朽的。 —— 艾普利亚
日记列表

- 2007年06月15日 03:28 星期五
支持正则表达式的编辑器:SED
今天有一个朋友让我帮他写一个正则表达式,来把网站日志中带有php的行挑出来。
原以为是在php或js下实现,我满口答应,可他说不是,是在ultraeditor下做这事情
。额的神哪,ultraeditor的正则表达式是公认的烂,用它的正则怎么可能找到东西?又问了一下,嗯,他那还有editplus,好吧,ep支持的正则比ue好多了,我研究研究去。
几分钟下来,我发现我错了……把日志中带有php的行找到没问题,问题是如何挑出来?好吧,换个思路,如何找到不含有php的行?我把ep的帮助文件翻来覆去的看,关于正则,总共就短短的几段话,里面关于反向的部分一句没有。那我该怎么办?
没办法,上网去找找有没什么对正则支持比较优秀的编辑器,搜索了一下,一大把都是正则的验证器,没看到什么能够吸引住我眼球的东西。等等,那是什么?sed
?stream editor?流编辑器?
在阅读完这位老兄(地址见上)的文章之后,我知道,sed就是我所需要的工具,于是,下载sed
,看sed中文文档
,研究语法,最终似乎还是帮他把问题解决。
对于sed我不加具体描述了,看上面提到的那篇blog就可以了解个大概了,再加上sourceforge上sed
的相关信息非常全面,包括下载、文档、实例、游戏(用文本编辑器写游戏,你听说过吗?),应有尽有,足够了解这个编辑器的了。
2007-6-27 0:21补充,郁闷地发现,ssed似乎对非utf-8的中文支持有点问题,不知道是不是我的命令有问题,我在给超过20字节的行首加入中文全角空格时,输出的文件居然是乱码,而在utf-8下,虽然不会乱码,但是却没加入应有的中文空格,英文空格倒是可以-。-






idea's blog
布拉格公园
冷韵的文字空间
Dawn.w/s weblog - Agoodb
Owen's Diary
我们俩