666
Stubborn 发表于 2019-3-10 22:07
我这个吗?
是的呀..妹子图那个网址..
靳泽宇 发表于 2019-3-11 10:01
是的呀..妹子图那个网址..
跑了 还有扒图片啊{:5_97:}
Stubborn 发表于 2019-3-11 13:19
跑了 还有扒图片啊
这怎么进网站呢..
靳泽宇 发表于 2019-3-11 14:07
这怎么进网站呢..
{:10_285:}怎么进网站什么意思?{:10_257:}
Stubborn 发表于 2019-3-11 15:13
怎么进网站什么意思?
爬虫爬的网站 https://www.mzitu.com/index/ 我想进去查看网站源代码。可以报403错误。。翻.墙也看不了。。
靳泽宇 发表于 2019-3-11 16:07
爬虫爬的网站 https://www.mzitu.com/index/ 我想进去查看网站源代码。可以报403错误。。翻.墙也看不 ...
进这个分析什么?网站https://www.mzitu.com这个是目标站
Stubborn 发表于 2019-3-11 16:10
进这个分析什么?网站https://www.mzitu.com这个是目标站
目标站进不去...不进去不知道xpath..也不知道源代码。。{:10_297:}
靳泽宇 发表于 2019-3-11 16:39
目标站进不去...不进去不知道xpath..也不知道源代码。。
目标站可以直接进,没有问题的1,进目标站,抓取每个图集的(通过翻页抓取后面数据),2,进入图集后获取到每个图片的url下载地址
Stubborn 发表于 2019-3-11 21:24
目标站可以直接进,没有问题的1,进目标站,抓取每个图集的(通过翻页抓取后面数据),2,进入图集后获 ...
我的目标站报403..
本帖最后由 靳泽宇 于 2019-3-12 08:45 编辑
Stubborn 发表于 2019-3-11 21:24
目标站可以直接进,没有问题的1,进目标站,抓取每个图集的(通过翻页抓取后面数据),2,进入图集后获 ...
我的报错..
靳泽宇 发表于 2019-3-12 08:44
我的报错..
https://www.mzitu.com 这个 老铁
Stubborn 发表于 2019-3-12 13:55
https://www.mzitu.com 这个 老铁
没错呀..可是他自动重定向进去/index..
靳泽宇 发表于 2019-3-12 13:59
没错呀..可是他自动重定向进去/index..
{:10_285:}那就不知道了
围观大佬
美女昆明
1
666
[*]第48行输出错误:不是print("采集图集URL错误"),你写成了print("采集图集RUL错误")
感谢