|
发表于 2021-5-11 17:58:59
|
显示全部楼层
[b]
加个 headers 参数即可
- import requests
- import bs4
- header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'}
- res =requests.get("https://movie.douban.com/top250",headers = header)
- soup = bs4.BeautifulSoup(res.text,"html.parser")
- targets = soup.find_all("div",class_="hd")
- for each in targets:
- print(each.a.span.text)
复制代码
输出结果:
- 肖申克的救赎
- 霸王别姬
- 阿甘正传
- 这个杀手不太冷
- 泰坦尼克号
- 美丽人生
- 千与千寻
- 辛德勒的名单
- 盗梦空间
- 忠犬八公的故事
- 星际穿越
- 楚门的世界
- 海上钢琴师
- 三傻大闹宝莱坞
- 机器人总动员
- 放牛班的春天
- 大话西游之大圣娶亲
- 疯狂动物城
- 无间道
- 熔炉
- 教父
- 当幸福来敲门
- 龙猫
- 怦然心动
- 控方证人
复制代码
[/b] |
|