kerln888 发表于 2022-6-2 16:26:07

求助啊!爬虫的问题

想抓取下面一段代码中<strong class></strong>之间的内容,要怎么才能抓取啊,大神们。
查看元素,里面是有数据的,如图,但是看源代码没有,这是为什么呢??要如果才能抓取到这个数据呢??
<div class="row notspacing level-size">
                  <div class="col-md-12">
                        <div class="ibox" style="margin-bottom: 10px;">
                            <div class="ibox-content">
                              <div class="today_people">
                                    <div class="row m-b-sm">
                                        <div class="col-md-12 level-text" id="total">
                                        </div>
                                    </div>
                                    <div class="row text-center m-b-sm">
                                        <div class="col-md-6">
                                          <strong class="text-danger level-text m-r-xs" id="enter"></strong>
                                        </div>
                                        <div class="col-md-6">
                                          <strong class="text-danger level-text m-r-xs" id="stay"></strong>
                                        </div>
                                    </div>
                                    <div class="row text-center m-b-sm">
                                        <div class="col-md-6">
                                          <strong class="text-danger level-text m-r-xs" id="enter_last_week"></strong>
                                        </div>
                                        <div class="col-md-6">
                                          <strong class="text-danger level-text m-r-xs" id="stay_last_week"></strong>
                                        </div>
                                    </div>
                                    <div class="row text-center">
                                        <button type="button" class="btn btn-success" onclick="emaps()" style="margin: 0;">电子地图</button>
                                    </div>
                              </div>
                            </div>
                        </div>
                  </div>

Twilight6 发表于 2022-6-2 16:30:18



js 动态渲染的,可以用 sselenium 加载页面

Twilight6 发表于 2022-6-2 16:34:14

Twilight6 发表于 2022-6-2 16:30
js 动态渲染的,可以用 sselenium 加载页面

多了个 s ,是 selenium

kerln888 发表于 2022-6-2 16:36:56

Twilight6 发表于 2022-6-2 16:34
多了个 s ,是 selenium

能麻烦说详细点嘛?版主大大。能给段代码参考下吗?谢谢了

liuzhengyuan 发表于 2022-6-2 21:46:15

发一下你要爬取的链接?

kerln888 发表于 2022-6-3 07:37:34

liuzhengyuan 发表于 2022-6-2 21:46
发一下你要爬取的链接?

不好意思,是公司内部的网页,外部访问不了

wp231957 发表于 2022-6-3 08:03:38

kerln888 发表于 2022-6-3 07:37
不好意思,是公司内部的网页,外部访问不了

那就只能你自己慢慢研究,别人也帮不了
因为要是有反爬的话,都需要抓包分析
现在只有你能抓包,所以也只有你能解决问题

临时号 发表于 2022-6-3 17:34:28

你这个页面是实时渲染的,要用selenium,你可以看一下这篇文章,https://www.likecs.com/show-203523456.html
页: [1]
查看完整版本: 求助啊!爬虫的问题