感觉这个代码和老师的差不了多少,可是为啥就不对呢(下载不了图片,求帮助)
import urllib.requestimport re
def open_url(url):
req = urllib.request.Request(url)
req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36')
page = urllib.request.urlopen(req)
html= page.read().decode('utf-8')
return html
def get_img(html):
p = r'<img src="([^"]+\.gif)" style='
imglist = re.findall(p, html)
for each in imglist:
print(each)
for each in imglist:
filename = each.split("/")[-1]
urllib.request.urlretrieve(each, filename, None)
if __name__ =='__main__':
url = 'https://tieba.baidu.com/p/2125145202?fid=8740&red_tag=3527456532#!/l/p1'
get_img(open_url(url))
正则不对,你对比下 ba21 发表于 2019-1-21 21:49
正则不对,你对比下
因为我们爬的网页也不一样那
卫123 发表于 2019-1-21 21:55
因为我们爬的网页也不一样那
那把正则学好吧 ba21 发表于 2019-1-21 22:26
那把正则学好吧
嗯嗯,看来正则的确是个问题
ba21 发表于 2019-1-21 22:26
那把正则学好吧
谢谢大佬
页:
[1]