鱼C论坛

 找回密码
 立即注册
楼主: ietar

[作品展示] 复习一下妹子图(啊不对)爬虫

  [复制链接]
发表于 2019-6-14 19:12:12 From FishC Mobile | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-6-14 19:30:00 | 显示全部楼层
666
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-6-14 20:03:16 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-6-14 20:13:57 | 显示全部楼层
点赞
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-6-14 21:46:42 | 显示全部楼层
还有这种功能
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-14 22:02:14 | 显示全部楼层
看一看呀
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-14 22:09:21 | 显示全部楼层
新手前来学习
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-15 09:05:14 | 显示全部楼层
ietar 发表于 2019-6-12 20:21
lxml也pip install一下..

感谢大佬,成功了,但是我把搜集地址改了,改成了你懂的其他网站,然后又报错了
how many:(max=24)24
Traceback (most recent call last):
  File "D:\Youku Files\meizitu.py", line 24, in <module>
    url = soup0.find('div', class_='main').find('div', class_='postlist')\
AttributeError: 'NoneType' object has no attribute 'find'
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-6-15 09:21:46 | 显示全部楼层
本帖最后由 ietar 于 2019-6-15 09:23 编辑
imcampbell 发表于 2019-6-15 09:05
感谢大佬,成功了,但是我把搜集地址改了,改成了你懂的其他网站,然后又报错了
how many:(max=24)24
T ...


其他网站当然得重新写爬虫了啊 网页结构都不一样
比如贴上来的这条语句 就是从网页里依次找几个不同属性的div 定位到需要的内容
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-15 09:43:48 | 显示全部楼层
哈哈哈,学习一下看呢
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-15 09:48:08 | 显示全部楼层
绝对要收藏的收东西。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-15 09:56:53 | 显示全部楼层
日渐消瘦,难搞哦
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-15 10:26:01 | 显示全部楼层
ietar 发表于 2019-6-15 09:21
其他网站当然得重新写爬虫了啊 网页结构都不一样
比如贴上来的这条语句 就是从网页里依次找几个不同属 ...

阿西吧。。。我有一个很劲爆的网站哦。。哈哈哈,好的,知道了,谢谢大佬
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-15 15:10:55 | 显示全部楼层
ietar 发表于 2019-6-14 16:55
我刚试了下 只爬了2个 改的是url0 没出现这个问题 是获取的不同资源

也就是说,这个不是“改改网页就行了”还得改一下其它的参数是吗?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-15 16:25:47 | 显示全部楼层
支持一下
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-15 16:50:48 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-6-15 17:27:54 | 显示全部楼层
优秀
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-6-15 18:12:43 | 显示全部楼层
了;
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-6-15 18:27:14 | 显示全部楼层
就因为有你这样的作品,使我学习速度更快。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-15 18:37:58 | 显示全部楼层
how many:(max=24)3
Traceback (most recent call last):
  File "D:\用户目录\新建文本文档.py", line 20, in <module>
    soup0 = BeautifulSoup(res0.text,'lxml')
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python37\lib\site-packages\bs4\__init__.py", line 196, in __init__
    % ",".join(features))
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?
>>>
这个是什么意思啊
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-7-13 17:53

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表