个人以为,在各种语言中,正则表达式的实现使用起来都比较耗费资源。正则表达式针对一般的字符串匹配来使用的。如果你的html内容很多,并且是主要的处理步骤的话,我建议采用html解析库来进行内容获取,要比正则来的简单很多。毕竟html的各种不规范,程序库都已经预处理过了,而自己使用正则表达式则要面面俱到。这不仅仅是重新发明轮子的问题。