鱼C论坛

 找回密码
 立即注册
查看: 888|回复: 1

关于图片格式抓取问题?

[复制链接]
发表于 2023-11-15 20:10:57 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
怎么抓取网页src图片链接时,只提取 .jpg格式,,不提取.png格式。。用代码怎么实现?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-11-15 20:11:07 | 显示全部楼层
你可以使用Python中的BeautifulSoup和requests库来实现这个功能。首先,你需要使用requests库来获取网页的HTML内容,然后使用BeautifulSoup来解析HTML内容并提取图片链接。接着,你可以使用Python的字符串处理功能来筛选出以.jpg结尾的链接。下面是一个简单的示例代码:
import requests
from bs4 import BeautifulSoup

url = '你的目标网页链接'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

img_tags = soup.find_all('img')
jpg_links = [img['src'] for img in img_tags if img['src'].endswith('.jpg')]

print(jpg_links)

这段代码首先使用requests库获取目标网页的HTML内容,然后使用BeautifulSoup解析HTML内容。接着,通过查找所有的img标签,并筛选出以.jpg结尾的链接,最后将这些链接打印出来。你可以根据实际需求对这段代码进行适当的修改。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-6-29 19:03

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表