Python3+MongoDB爬取链接所有二手房信息,学以致用
过了爬妹子图的年纪了,找找链家的好房。目标:链家-二手房
地区:重庆各大区
存储:MongoDB,默认各位已经安装好了,MySQL关系数据库用着不够灵活。
上个图吧,这是mongo筛选打出来的,实际爬取的信息更多。
这个是实际数据输出。
以下是代码,修修补补添加有点多,大佬们将就看看,把url改成你们省份的也可以爬,那天改成北京的试了试可以的,最近今天在看数据分析,后续上一个有关房价的数据分析。
**** Hidden Message *****
多进程爬取效率比较高,目前版本默认有的分区全部爬取,但是链家只给了100页数据 超过100页的好像爬不到。 最开始是保存CSV文件的 你们把注释放开也可以保存,用上mongo后就没用文件存储了,毕竟不好分析一个个文件。 我想问一下我直接按别的代码写的,然后村到mongo数据库里面,那我怎么查看这个数据库啊 我来学习一下 多谢楼主提供这个. 本帖最后由 yyyyttt 于 2020-6-18 11:26 编辑
感谢 {:10_277:}{:10_254:} 学习一下
牛
66666 感谢大佬 学习一下
页:
[1]