鱼C论坛

 找回密码
 立即注册
查看: 700|回复: 3

python爬虫网站图片求助

[复制链接]
发表于 2020-4-29 13:27:17 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
求助各位大佬
在编写爬虫的时候 希望实现爬取网页上的验证码图片地址,在分析的时候可以看到src地址,但在获取的时候显示为空 这是什么原因呢?

网站分析图:
<img id="imagecode" style="position:absolute; top:142px; left:300px;" src="http://51moni-sh.oss-cn-shanghai.aliyuncs.com/yzm1707/o1128.png">

附上代码:
import re  
import requests
import os
import bs4

headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 "
                  "Safari/537.36 Core/1.70.3704.400 QQBrowser/10.4.3588.400"}


url = "http://www.yunpaiwang.net/paishanghaichepailianxi/"
html = requests.get(url,headers = headers).text
#print(html)

soup=BeautifulSoup(html,"html.parser")

target = soup.find("div", id="imagecodtest")

img_ = soup.find("div", id="imagecodtest").find("img")
print(img_)
img_.get("src")
print(img_.get("src"))
url_list = []
for url in img_:
    url_list.append(img_.get("src"))
print(url_list)


代码显示:
<img id="imagecode" style="position:absolute; top:142px; left:300px;"/>
None
[]

网站分析图:

网站分析图:

显示图

显示图
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-29 18:29:00 | 显示全部楼层
我不懂。充当大好佬一下,是否是cookie的问题呢?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-29 19:18:58 | 显示全部楼层
本帖最后由 Twilight6 于 2020-4-29 19:22 编辑

这应该是被网站的js动态渲染了页面,浏览器可以通过读取js来获取链接,但我们这样单纯抓取页面信息是不行的。我前几天爬迅雷链接就是,链接在js文件中,要提取js内容好像蛮麻烦的,然后我就放弃了

你可以去浏览器F12的Network里面看下js后缀的包,链接应该就在里面
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-29 19:35:26 | 显示全部楼层
爬虫,最基本的就是,需要确定,需要的东西,是否存在网页源码中,右键,查看网页源码,有,静态,没有,则通过其他方式生成的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-27 01:39

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表