lpfight 发表于 2020-6-23 16:45:50

Python 爬虫如何获取 JS 生成的 URL 和网页内容?

求助
新手上路,想爬取一个网站上"碧蓝之海"的漫画,但是返回的网站源码没办法用常用的方法去提取图片链接,
求助
授人以鱼不如授人以渔,有老哥可以讲一下 原理或者去哪里可以学习的网站吗?

返回的部分网站源码如下:
</div>
<img src="/static/images/mh_loading.gif" id="comic_pic" onClick="nextpage();" width="100%" alt="GRAND BLUE 碧蓝之海(51)" />
<div class="addg"><script>insert.show_lmt_n1()</script></div>
<div class="bo_nav">
    <a href="/comic/22899/1086340.html" id="surl"><i class="iconfont icon-left"></i>&nbsp;上一章</a>
    <a href="javascript:backpage();"><i class="iconfont icon-left"></i>&nbsp;上一页</a>
    <a href="javascript:nextpage();">下一页&nbsp;<i class="iconfont icon-right"></i></a>
    <a href="/comic/22899/1246245.html" id="xurl">下一章&nbsp;<i class="iconfont icon-right"></i></a>
</div>

wp231957 发表于 2020-6-23 17:08:32

放网址啊,这基本常识还用???

suchocolate 发表于 2020-6-23 17:24:18

另外一个帖子已经回过了,参照搞搞。
想学爬虫去买书。
页: [1]
查看完整版本: Python 爬虫如何获取 JS 生成的 URL 和网页内容?