鱼C论坛

 找回密码
 立即注册
查看: 1347|回复: 9

[已解决]爬百度贴吧图片,并将其放在F盘,却发现C盘突然减少20G

[复制链接]
发表于 2019-8-30 15:29:13 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 wang_ 于 2019-8-30 15:30 编辑

昨天下午,写了一个简单的爬虫程序,试着爬取百度贴吧部分图片。虽然成功爬取,但是突然发现C盘空间减少20G(爬取的图片放在F盘),求助大佬 ,希望知道是怎么回事
以下是源代码(源代码文件也放在F盘):

游客,如果您要查看本帖隐藏内容请回复
最佳答案
2019-8-30 17:45:49
可能跟你的代码没有关系。。。如果你爬取的数据量很小的话

我也遇到过这样的问题,原因是系统自动备份,占据了20G

可以清理一下电脑
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-8-30 16:02:36 | 显示全部楼层
会不会跟你的代码一点关系也没有
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-8-30 16:11:57 | 显示全部楼层
根本没有涉及到 os 操作
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-8-30 16:16:13 | 显示全部楼层
zltzlt 发表于 2019-8-30 16:11
根本没有涉及到 os 操作

这一步吧

  1. urllib.request.urlretrieve(each, filename,None)
复制代码


不过路径没指定的话应该是在当前路径。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-8-30 17:28:04 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-8-30 17:45:49 | 显示全部楼层    本楼为最佳答案   
可能跟你的代码没有关系。。。如果你爬取的数据量很小的话

我也遇到过这样的问题,原因是系统自动备份,占据了20G

可以清理一下电脑
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-8-30 19:23:17 | 显示全部楼层
瞅瞅
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2019-9-3 15:50:54 | 显示全部楼层
facevoid 发表于 2019-8-30 17:45
可能跟你的代码没有关系。。。如果你爬取的数据量很小的话

我也遇到过这样的问题,原因是系统自动备份, ...

好像是的,消失的20G最近渐渐回来了。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-9-3 15:53:05 | 显示全部楼层
facevoid 发表于 2019-8-30 17:45
可能跟你的代码没有关系。。。如果你爬取的数据量很小的话

我也遇到过这样的问题,原因是系统自动备份, ...

还有想问一下,我爬取的数据量大概是几十张图片的样子,系统备份会占据20G
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-9-3 16:56:48 | 显示全部楼层
wang_ 发表于 2019-9-3 15:53
还有想问一下,我爬取的数据量大概是几十张图片的样子,系统备份会占据20G

我这个系统备份是说系统如果系统有很大的更新会把c盘里关键的东西复制一份,你可以查看一下c盘的隐藏文件夹,一般有一个window.old,会占据很大空间。

我是直接把它删除了,爽多了。。。

另外你如果设置系统自动创建还原点的话系统也会自动占据很大空间。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-12 05:01

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表