.*?',htmlSource) for link in linksList: print link">
 | 注册
请输入搜索内容

热门搜索

Java Linux MySQL PHP JavaScript Hibernate jQuery Nginx
pythopen
9年前发布

python通过正则获取网页上的全部链接

import re, urllib  htmlSource = urllib.urlopen("http://www.sharejs.com").read(200000)  linksList = re.findall('<a href=(.*?)>.*?</a>',htmlSource)  for link in linksList:      print link