怎样用正则表达式提取一篇新闻的内容

2025-04-08 09:58:42
推荐回答(1个)
回答1:

首先,要确定新闻内容中,是否含有“”标签,如果含有,那么单纯的正则是无法实现的,因为,正则无法确定标签的配对情况,只能通过程序是实现。若不含有,正则倒是可以,用:publicstaticvoidmain(String[]args){Stringhtml="";//抓取到的网页内容Patternpatt=Pattern.compile("(.*?)");Matchermatc=patt.matcher(html);if(matc.find()){Stringtemp=matc.group(1).replaceAll("","");//获取新闻,且去除所有标签System.out.println(temp);}}