[已解决]网页爬取的问题请教

1029482962 · 发表于 2020-5-23 15:14:32

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

请问，在get网页时：
我想get京东某商品页面的信息，代码与报告如下：
import requests
try:#记得爬取网站的时候都要添加try,except函数。
r=requests.get("https://item.jd.com/37244559167.html")
print(r.status_code)#每一次都可以status_code检查一下是否正确访问
r.raise_for_status#这个函数能保证如果返回200不产生异常，否则产生异常
r.encoding=r.apparent_encoding
print(r.text[:1000])
except:
print("爬取失败")
报告：
200
<script>window.location.href='https://passport.jd.com/uc/login?ReturnUrl=http://item.jd.com/37244559167.html'</script>
200也就是说成功获取了吧，但为什么又没有信息呀？
同样的代码，我用淘宝的商品网页就可以访问。。。。。

最佳答案

月排行榜 / 总排行榜

wp231957

2020-5-24 23:33:58

r.text就是获取页面源码
如果网站是通过ajax技术，那源码就不是你想要的

跳转到最佳答案楼层

xiaosi4081 · 发表于 2020-5-24 07:45:33

？？？

wp231957 · 发表于 2020-5-24 23:33:58

这个最佳答案由 wp231957 给出，感谢 wp231957 的回答。

单击隐藏图章

r.text就是获取页面源码
如果网站是通过ajax技术，那源码就不是你想要的

kaohsing · 发表于 2020-5-31 07:40:40

要找到真实数据地址，请求后，解析网页源码即可。

账号		自动登录	找回密码
密码			立即注册

[已解决]网页爬取的问题请教

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块