鱼C论坛

 找回密码
 立即注册
查看: 5092|回复: 17

[已解决]python 爬虫(数据存在干扰),图片识别

[复制链接]
发表于 2022-9-28 18:55:15 | 显示全部楼层
可以把网址说一下吗
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-9-28 20:21:26 | 显示全部楼层
<div class="result_factory" title="ST">ST</div>
                                <div class="result_batchNumber" title="21+">21+</div>
                                                                                                                        <div class="result_totalNumber jvdnikhdyvggmfz" title="5060">5060</div>
                                                                                                                                        <div class="result_totalNumber nxnwaojfxudjjew" title="2380">2380</div>
                                                                                                                                        <div class="result_totalNumber iwpjacfjhbvwjwd" title="8460">8460</div>
                                                                                                        <div class="result_totalNumber qyfvvxjjzjamfhr" title="3160">3160</div>
                                                                                                                                        <div class="result_totalNumber dvrgdyfvisvsprm" title="9440">9440</div>
                                                                                                                                        <div class="result_totalNumber ldsyrezljbuzhoo" title="5140">5140</div>
                                                                                                                                                                                                <div class="result_pakaging" title="LQFP100">LQFP100</div>
                                <div class="result_prompt">
                                        <div class="result_explain" title="亿鑫达微!只有原装">亿鑫达微!只有原装</div>
                                        <div class="result_kwplace" title="深圳3160" style="display:block">库位:深圳</div>
                                </div>
                                <div class="result_date" title="09-28">09-28<input type="hidden" value="2022-09-28 18:21:00"></div>
                                <div class="result_askPrice">


在你获取到数据的下一个div里,注意到里面有个类似于这样的标签:
<div class="result_kwplace" title="深圳3160" style="display:block">库位:深圳</div>
数字3160可以在这里面获取, title="深圳3160", 从这个title里面获取
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-9-29 17:07:28 | 显示全部楼层
灰晨 发表于 2022-9-29 12:14
不是全都有,有部分数量被吃,还有没有库位的话title直接没数据了,而网页上是有的

你是通过selenium获取的数据还是,用requests获取的数据是不是混淆过的
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-9-29 17:11:45 | 显示全部楼层
这个网站确实不太好整
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-10-5 02:59

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表