3236654291 发表于 2021-7-23 18:05:37

python 图片地址被隐藏

本帖最后由 3236654291 于 2021-7-23 23:41 编辑

问题如上
链接为https://m.bnmanhua.com/comic/713/1031165.html?p=4
爬取这个网页源代码后,图片地址与原来的不一样
原来的

爬取的

怎么办{:10_266:}

笨鸟学飞 发表于 2021-7-24 08:53:24

你找错了撒,在这
<script>
    var state='1';
    var z_img='["upload/files/713/1031165/15626920870.jpg","upload/files/713/1031165/15626920881.jpg","upload/files/713/1031165/15626920882.jpg","upload/files/713/1031165/15626920883.jpg","upload/files/713/1031165/15626920894.jpg","upload/files/713/1031165/15626920895.jpg","upload/files/713/1031165/15626920896.jpg","upload/files/713/1031165/15626920897.jpg","upload/files/713/1031165/15626920908.jpg","upload/files/713/1031165/15626920909.jpg","upload/files/713/1031165/156269209010.jpg","upload/files/713/1031165/156269209011.jpg","upload/files/713/1031165/156269209112.jpg","upload/files/713/1031165/156269209113.jpg"]';
    // var locks='';
    var locks='';
</script>

3236654291 发表于 2021-7-24 09:30:02

笨鸟学飞 发表于 2021-7-24 08:53
你找错了撒,在这

    var state='1';


为什么有这么多个地址,而且这地址还是登不了

笨鸟学飞 发表于 2021-7-24 16:19:54

url是m.开头,一般页面是为手机或平板等移动设备浏览用的。
有个特点,页面显示不完整的,有上一页下一页,上一章下一章之类的
你打开你发的url,发现上面有(4/14)
我目测,用电脑设备浏览正常url的时候,这14张漫画图是在一个页面上
手机分页分成了14分,正好对应我之前标红的这14个地址
你再右键检查图片地址,会发现图片真实地址是
https://img.hltongchen.com/upload/files/713/1031165/15626920883.jpg
其他的不难拼出来吧?

3236654291 发表于 2021-7-24 17:46:12

哦,感谢大佬,其他的我可以{:9_228:}
页: [1]
查看完整版本: python 图片地址被隐藏