|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
代码部分:
import requests
import bs4
res = requests.get('https://movie.douban.com/top250')
soup = bs4.BeautifulSoup(res.text,'html.parser')
targets=soup.find_all('div',class_='hd')
for each in targets:
print(each.a.span.text)
返回部分:
这个网页你没有爬取成功:
- print(res.status_code)
- 运行结果:
- 418
复制代码
不是200,所以没有爬取成功。
可能是这个网页不让代码去爬,
解决方案就是在获取网页是代码添加头,
代码如下:
- import requests
- import bs4
- head = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.42 Safari/537.36'}
- res = requests.get('https://movie.douban.com/top250', headers=head)
- soup = bs4.BeautifulSoup(res.text,'html.parser')
- targets=soup.find_all('div',class_='hd')
- for each in targets:
- print(each.a.span.text)
复制代码
|
|