|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
试了一下小甲鱼的抓取豆瓣top250电影的代码
#爬取豆瓣top250电影排行榜
import requests
import bs4
res=requests.get("https://movie.douban.com/top250")
soup=bs4.BeautifulSoup(res.text,"html.parser")
targets=soup.find_all("div",class_="hd")
for each in targets:
print (each.a.span.text)
得到的数据为空。
求答疑。
加一个 headers 就好了:
- #爬取豆瓣top250电影排行榜
- import requests
- import bs4
- headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36'}
- res = requests.get("https://movie.douban.com/top250", headers = headers)
- soup = bs4.BeautifulSoup(res.text, "html.parser")
- targets = soup.find_all("div", class_="hd")
- for each in targets:
- print(each.a.span.text)
复制代码
|
|