鱼C论坛

 找回密码
 立即注册
查看: 2635|回复: 5

为什么http://www.fishc.com爬下是这样子的

[复制链接]
发表于 2020-11-17 21:11:56 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
Why?
捕1获.PNG
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-11-17 22:13:11 | 显示全部楼层
没代码不好告诉你为什么,我这爬取没问题
  1. import requests


  2. def geturl(url):
  3.     headers = {
  4.         'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3776.400 QQBrowser/10.6.4212.400'
  5.     }
  6.     res = requests.get(url,headers=headers)
  7.     if res.status_code != 200:
  8.         print('爬取异常,请检查网络后稍后重试!')
  9.     else:
  10.         return res

  11. def main():
  12.     url = 'https://movie.douban.com/top250'
  13.     res = geturl(url)
  14.     print(res.text)

  15. if __name__ == '__main__':
  16.     main()
复制代码


想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-11-17 22:27:38 | 显示全部楼层
笨鸟学飞 发表于 2020-11-17 22:13
没代码不好告诉你为什么,我这爬取没问题

你这个代码我第一行报错
ModuleNotFoundError: No module named 'requests'
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-11-18 09:05:15 | 显示全部楼层
qin_yin 发表于 2020-11-17 22:27
你这个代码我第一行报错
ModuleNotFoundError: No module named 'requests'

pip install requests
你没装第三方库
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-11-18 11:01:02 | 显示全部楼层
qin_yin 发表于 2020-11-17 22:27
你这个代码我第一行报错
ModuleNotFoundError: No module named 'requests'

装下模块吧,写爬虫必备的 requests模块,和BeautifulSoup模块
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-11-18 12:39:22 | 显示全部楼层
本帖最后由 _荟桐_ 于 2020-11-18 12:40 编辑

是要爬鱼c论坛主页还是有视频的那个页面?
主页www.fishc.com.cn
打开有个视频的那个网页是www.fishc.com
这两个网址不一样,打开看看就知道了


而且爬下来的是网页的源代码,用html打开有些内容显示不了(应该把文件后缀改成txt)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-16 03:53

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表