卫123 发表于 2019-1-21 21:39:52

感觉这个代码和老师的差不了多少,可是为啥就不对呢(下载不了图片,求帮助)

import urllib.request
import re

def open_url(url):
    req = urllib.request.Request(url)
    req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36')
    page = urllib.request.urlopen(req)
    html= page.read().decode('utf-8')
    return html
def get_img(html):
    p = r'<img src="([^"]+\.gif)" style='
    imglist = re.findall(p, html)
    for each in imglist:
      print(each)


    for each in imglist:
      filename = each.split("/")[-1]
      urllib.request.urlretrieve(each, filename, None)
      

if __name__ =='__main__':
    url = 'https://tieba.baidu.com/p/2125145202?fid=8740&red_tag=3527456532#!/l/p1'
    get_img(open_url(url))

ba21 发表于 2019-1-21 21:49:30

正则不对,你对比下

卫123 发表于 2019-1-21 21:55:19

ba21 发表于 2019-1-21 21:49
正则不对,你对比下

因为我们爬的网页也不一样那

ba21 发表于 2019-1-21 22:26:50

卫123 发表于 2019-1-21 21:55
因为我们爬的网页也不一样那

那把正则学好吧

卫123 发表于 2019-1-21 22:28:59

ba21 发表于 2019-1-21 22:26
那把正则学好吧

嗯嗯,看来正则的确是个问题

卫123 发表于 2019-1-21 22:29:34

ba21 发表于 2019-1-21 22:26
那把正则学好吧

谢谢大佬
页: [1]
查看完整版本: 感觉这个代码和老师的差不了多少,可是为啥就不对呢(下载不了图片,求帮助)