python爬虫爬取豆瓣科幻电影名单为啥爬取不了？

浮华_warren · 发表于 2021-2-19 16:40:06

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由浮华_warren 于 2021-2-19 16:42 编辑

import requests
from bs4 import BeautifulSoup
def get_movies():
headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:85.0) Gecko/20100101 Firefox/85.0','Host':'movie.douban.com'}
sciencemovies_list=[]
link='https://movie.douban.com/explore#!type=movie&tag=%E7%A7%91%E5%B9%BB&sort=rank&page_limit=20&page_start=0'
r=requests.get(link,headers=headers)
soup=BeautifulSoup(r.text,'lxml')
list_movies=soup.find_all('a',class_='item')
for each in list_movies:
movie=each.p.text
sciencemovies_list.append(movie)
return sciencemovies_list
movies=get_movies()
print(movies)

复制代码

YunGuo · 发表于 2021-2-19 19:41:49

网页源代码中不存在数据，你能爬取到那才是奇迹。。。

去请求数据接口获取数据：https://movie.douban.com/j/search_subjects
携带参数：
type：movie （固定）
tag：科幻（类型）
sort：rank（排序方式，按评价排序，可以固定，除非你有其它要求）
page_limit：20（每一页显示数，可以固定）
page_start：0（翻页参数，每一页+20）

浮华_warren · 发表于 2021-2-19 19:48:57

YunGuo 发表于 2021-2-19 19:41
网页源代码中不存在数据，你能爬取到那才是奇迹。。。

去请求数据接口获取数据：https://movie.douban.c ...

好的，谢谢

心驰神往 · 发表于 2021-2-22 09:06:06

解决了吗，lz

墨砚学长 · 发表于 2021-2-22 09:24:24

插眼

何处追寻 · 发表于 2021-2-22 11:16:16

都是大佬

Minecraft程序猿 · 发表于 2021-2-22 12:13:16

2001:太空漫游

账号		自动登录	找回密码
密码			立即注册

python爬虫爬取豆瓣科幻电影名单为啥爬取不了？

马上注册，结交更多好友，享用更多功能^_^

回帖奖励 +1 鱼币

回帖奖励 +1 鱼币

回帖奖励 +1 鱼币

回帖奖励 +1 鱼币

回帖奖励 +1 鱼币

浏览过的版块