[已解决]跟着小甲鱼的视频操作却爬取不到top250电影的名字

15070159117 · 发表于 2023-10-25 21:31:33

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import requests
import bs4
res = requests.get('https://movie.douban.com/top250')
soup = bs4.BeautifulSoup(res.text,'html.parser')
targets = soup.find_all('div',class_='hd')
for each in targets:
print(each.a.span.text)

for each in targets:
print(each.a.span.text)

到最后打印不出结果，请问哪出问题了？

最佳答案

月排行榜 / 总排行榜

liuzhengyuan

2023-10-26 08:38:20

被反爬虫了（这个网站只会给浏览器发送数据）
需要加一个 headers 来假装自己是浏览器

import requests
import bs4
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
res = requests.get('https://movie.douban.com/top250', headers=headers)
soup = bs4.BeautifulSoup(res.text,'html.parser')
targets = soup.find_all('div',class_='hd')
print(targets)
for each in targets:
print(each.a.span.text)

复制代码

跳转到最佳答案楼层

isdkz · 发表于 2023-10-25 21:31:40

问题出在代码的循环部分。在你的代码中，你使用了两个相同的循环来打印电影的名字。这就导致了重复打印的问题。

解决这个问题的方法是将两个循环合并为一个循环，这样就可以正确地打印出电影的名字。以下是修改后的代码：

import requests

import bs4

res = requests.get('https://movie.douban.com/top250')

soup = bs4.BeautifulSoup(res.text, 'html.parser')

targets = soup.find_all('div', class_='hd')

for each in targets:

print(each.a.span.text)

复制代码

这样就可以正确地打印出top250电影的名字了。

15070159117 · 发表于 2023-10-25 21:43:44

不是这个问题诶，两次打印是因为我第一次打印在IDLE中没有结果，所以再试了一次，结果还是没用

liuzhengyuan · 发表于 2023-10-26 08:38:20

这个最佳答案由 liuzhengyuan 给出，感谢 liuzhengyuan 的回答。

单击隐藏图章

被反爬虫了（这个网站只会给浏览器发送数据）
需要加一个 headers 来假装自己是浏览器

import requests
import bs4
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
res = requests.get('https://movie.douban.com/top250', headers=headers)
soup = bs4.BeautifulSoup(res.text,'html.parser')
targets = soup.find_all('div',class_='hd')
print(targets)
for each in targets:
print(each.a.span.text)

复制代码

15070159117 · 发表于 2023-10-26 09:59:15

liuzhengyuan 发表于 2023-10-26 08:38
被反爬虫了（这个网站只会给浏览器发送数据）
需要加一个 headers 来假装自己是浏览器

感谢大大，折腾好久了

账号		自动登录	找回密码
密码			立即注册

[已解决]跟着小甲鱼的视频操作却爬取不到top250电影的名字

马上注册，结交更多好友，享用更多功能^_^

本帖被以下淘专辑推荐: