[已解决]求助python

zjxqqq · 发表于 2020-11-18 16:55:54

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

新人求助，为啥我这个打印不出地址啊，结果既不报错，也没有结果，希望有人能帮忙解答一下
源码如下

import urllib.request
import re

def url_open(url):
req = urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3766.400 QQBrowser/10.6.4163.400')
#req.add_header('Referer','http://wwww.mzitu.com')#设置请求头，不加爬下来的都是防盗图
page = urllib.request.urlopen(req)
html = page.read().decode('utf-8')
return html

def get_img(html):
p = r'<img class="lazy" src="[^"]+\.jpg"'
imglist = re.findall(p,html)

for each in imglist:
print(each)

if __name__ == '__main__':
url = "https://www.mzitu.com/page/2/"
get_img(url_open(url))

最佳答案

月排行榜 / 总排行榜

Twilight6

2020-11-18 18:59:25

你正则匹配不到数据，我改了下

参考代码：

import urllib.request

import re

def url_open(url):

req = urllib.request.Request(url)

req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3766.400 QQBrowser/10.6.4163.400')

# req.add_header('Referer','https://www.mzitu.com') #设置请求头，不加爬下来的都是防盗图

page = urllib.request.urlopen(req)

html = page.read().decode('utf-8')

return html

def get_img(html):

p = r"<img class=.+? .+ data-original=('.+.jpg')"

imglist = re.findall(p,html)

for each in imglist:

print(each)

if __name__ == '__main__':

url = "https://www.mzitu.com/page/2/"

get_img(url_open(url))
复制代码

另外你 Referer 的网址多了个 w ，少了个s 帮你改了

跳转到最佳答案楼层

zjxqqq · 发表于 2020-11-18 17:10:06

没人吗

Twilight6 · 发表于 2020-11-18 18:59:25

这个最佳答案由 Twilight6 给出，感谢 Twilight6 的回答。

单击隐藏图章

你正则匹配不到数据，我改了下

参考代码：

import urllib.request

import re

def url_open(url):

req = urllib.request.Request(url)

req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3766.400 QQBrowser/10.6.4163.400')

# req.add_header('Referer','https://www.mzitu.com') #设置请求头，不加爬下来的都是防盗图

page = urllib.request.urlopen(req)

html = page.read().decode('utf-8')

return html

def get_img(html):

p = r"<img class=.+? .+ data-original=('.+.jpg')"

imglist = re.findall(p,html)

for each in imglist:

print(each)

if __name__ == '__main__':

url = "https://www.mzitu.com/page/2/"

get_img(url_open(url))
复制代码

另外你 Referer 的网址多了个 w ，少了个s 帮你改了

账号		自动登录	找回密码
密码			立即注册