如果用自己的User-Agent，imglist始终为空，但是用小甲鱼课件中的，运行没问题

python_xiaozhu · 发表于 2018-1-30 15:37:36

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import urllib.request
import re
def url_open(url):
req = urllib.request.Request(url)
# req.add_header('User-Agent','Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Mobile Safari/537.36')
#上面的隐藏的属于自己电脑的User-Agent,下面的属于小甲鱼课件中的
req.add_header('User-Agent','Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36')
response = urllib.request.urlopen(req)
html = response.read().decode('utf-8')

return html

def get_img(html):
p = r'<img class="BDE_Image" src="[^"]+\.jpg"'
# 除了双引号之外的字符一次或者多次
imglist = re.findall(p, html)

for each in imglist:
print(each)

if __name__ == '__main__':
url="http://tieba.baidu.com/p/3563409202"
get_img(url_open(url))

ba21 · 发表于 2018-1-30 15:38:45

正则不对

sky · 发表于 2018-1-30 15:42:34

本帖最后由 sky 于 2018-1-30 16:16 编辑

python_xiaozhu · 发表于 2018-1-30 15:47:42

ba21 发表于 2018-1-30 15:38
正则不对

正则没问题呀只要更改User-Agent就可以正常下载图片

python_xiaozhu · 发表于 2018-1-30 15:48:35

sky 发表于 2018-1-30 15:42
你的ua应该是手机的ua
这样贴吧返回的页面没有图片的

我这个也是在电脑版查看的，以前的都没问题

sky · 发表于 2018-1-30 15:55:00

本帖最后由 sky 于 2018-1-30 16:16 编辑

技术农民 · 发表于 2018-3-26 10:16:05

python_xiaozhu 发表于 2018-1-30 15:48
我这个也是在电脑版查看的，以前的都没问题

# req.add_header('User-Agent','Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Mobile Safari/537.36')

你这个明显是手机的，肯定查看不了，SKY，说的是对的。你重新获取一下，我第一次做这个程序和你的问题一样，后来重新获取了一下，就可以了。

User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3346.9 Safari/537.36

账号		自动登录	找回密码
密码			立即注册