<a href="http://news.hsw.cn/younews/">前一页</a> <a href="http://news.hsw.cn/system/more/25330000/0000/25330000_00000011.shtml">下一页</a>
<a href="http://news.hsw.cn/system/more/25330000/0000/25330000_00000012.shtml">下一页</a>
<a href="http://news.hsw.cn/system/more/25330000/0000/25330000_00000012.shtml">前一页</a> <a href="http://news.hsw.cn/system/more/25330000/0000/25330000_00000010.shtml">下一页</a>
需要匹配 下一页 的URL
我是用的正则如下
re.compile(r'(?<=[\n| ])<a href="(http://news.hsw.cn/system/more/.*?)">下一页</a>')
但是取不到第三种情况的URL,匹配结果是
http://news.hsw.cn/system/more/25330000/0000/25330000_00000012.shtml">前一页</a> <a href="http://news.hsw.cn/system/more/25330000/0000/25330000_00000010.shtml
求指点!
<a href="http://news.hsw.cn/system/more/25330000/0000/25330000_00000012.shtml">下一页</a>
<a href="http://news.hsw.cn/system/more/25330000/0000/25330000_00000012.shtml">前一页</a> <a href="http://news.hsw.cn/system/more/25330000/0000/25330000_00000010.shtml">下一页</a>
需要匹配 下一页 的URL
我是用的正则如下
re.compile(r'(?<=[\n| ])<a href="(http://news.hsw.cn/system/more/.*?)">下一页</a>')
但是取不到第三种情况的URL,匹配结果是
http://news.hsw.cn/system/more/25330000/0000/25330000_00000012.shtml">前一页</a> <a href="http://news.hsw.cn/system/more/25330000/0000/25330000_00000010.shtml
求指点!
