鱼C论坛

 找回密码
 立即注册
查看: 1519|回复: 2

[已解决]爬虫豆瓣top250,代码无反应

[复制链接]
发表于 2021-8-6 15:03:29 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import requests
>>> import bs4
>>> headers = ('User-Agent: Mozilla/5.0(Windows NT 10.0;WOW64)AppleWebKit/537.36(HHTML,like Gecko)Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0')
>>> res = requests.get('https://movie.douban.com/top250,headers=headers')
>>> soup = bs4.BeautifulSoup(res.text,'html.parser')
>>> targets = soup.find_all('div',class_='hd')
>>> for each in targets:
        print(each.a.span.text)

向各位前辈请教!!!
代码如上,运行后无反应,不知道是反爬虫的原因还是编辑错误。
根据小甲鱼爬虫案例敲上去的,不过又按照评论加了一点更改。
最佳答案
2021-8-6 17:18:22
第六行代码的引号位置打错了


  1. import requests
  2. import bs4
  3. headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
  4.            'cookie': 'BIDUPSID=45588421F978DE2902A1A47464D72AB3; PSTM=1609986056; BAIDUID=45588421F978DE29E3D21BB7BB5A6873:FG=1; REALTIME_TRANS_SWITCH=1; FANYI_WORD_SWITCH=1; HISTORY_SWITCH=1; SOUND_SPD_SWITCH=1; SOUND_PREFER_SWITCH=1; __yjs_duid=1_e3607a56e43709e2ca3db4147c46396a1612784778582; BAIDUID_BFESS=45588421F978DE29E3D21BB7BB5A6873:FG=1; Hm_lvt_64ecd82404c51e03dc91cb9e8c025574=1614696427; Hm_lpvt_64ecd82404c51e03dc91cb9e8c025574=1614697139; __yjsv5_shitong=1.0_7_253e552513b2cf371866473b2e57fb4e5137_300_1614697145680_59.50.85.17_fe15699c; ab_sr=1.0.0_ZDRiZDU1NjAzNjRkMDUyOWE3ZTg3MWZlMjRhMGE4NzkwYmI3N2ExMzliMjY3MjIxOGIyY2EyMmMxNWQzOWFmY2UyZDZjMGFkYzVjNWZkNGQ1ZWIxMTJmYjZjM2Y0M2M2'}
  5. res = requests.get('https://movie.douban.com/top250',headers=headers)
  6. soup = bs4.BeautifulSoup(res.text,'html.parser')
  7. targets = soup.find_all('div',class_='hd')
  8. for each in targets:
  9.         print(each.a.span.text)
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-6 17:18:22 | 显示全部楼层    本楼为最佳答案   
第六行代码的引号位置打错了


  1. import requests
  2. import bs4
  3. headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
  4.            'cookie': 'BIDUPSID=45588421F978DE2902A1A47464D72AB3; PSTM=1609986056; BAIDUID=45588421F978DE29E3D21BB7BB5A6873:FG=1; REALTIME_TRANS_SWITCH=1; FANYI_WORD_SWITCH=1; HISTORY_SWITCH=1; SOUND_SPD_SWITCH=1; SOUND_PREFER_SWITCH=1; __yjs_duid=1_e3607a56e43709e2ca3db4147c46396a1612784778582; BAIDUID_BFESS=45588421F978DE29E3D21BB7BB5A6873:FG=1; Hm_lvt_64ecd82404c51e03dc91cb9e8c025574=1614696427; Hm_lpvt_64ecd82404c51e03dc91cb9e8c025574=1614697139; __yjsv5_shitong=1.0_7_253e552513b2cf371866473b2e57fb4e5137_300_1614697145680_59.50.85.17_fe15699c; ab_sr=1.0.0_ZDRiZDU1NjAzNjRkMDUyOWE3ZTg3MWZlMjRhMGE4NzkwYmI3N2ExMzliMjY3MjIxOGIyY2EyMmMxNWQzOWFmY2UyZDZjMGFkYzVjNWZkNGQ1ZWIxMTJmYjZjM2Y0M2M2'}
  5. res = requests.get('https://movie.douban.com/top250',headers=headers)
  6. soup = bs4.BeautifulSoup(res.text,'html.parser')
  7. targets = soup.find_all('div',class_='hd')
  8. for each in targets:
  9.         print(each.a.span.text)
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-8-7 15:55:57 | 显示全部楼层
逃兵 发表于 2021-8-6 17:18
第六行代码的引号位置打错了

谢谢,萌新,只是对着敲进去了,没法发现问题所在,十分感谢。我再查一下这里的知识点
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-20 07:14

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表