关于图片格式抓取问题？

zyj1214 · 发表于 2023-11-15 20:10:57

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

怎么抓取网页src图片链接时，只提取 .jpg格式，，不提取.png格式。。用代码怎么实现？

isdkz · 发表于 2023-11-15 20:11:07

你可以使用Python中的BeautifulSoup和requests库来实现这个功能。首先，你需要使用requests库来获取网页的HTML内容，然后使用BeautifulSoup来解析HTML内容并提取图片链接。接着，你可以使用Python的字符串处理功能来筛选出以.jpg结尾的链接。下面是一个简单的示例代码：

import requests

from bs4 import BeautifulSoup

url = '你的目标网页链接'

response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

img_tags = soup.find_all('img')

jpg_links = [img['src'] for img in img_tags if img['src'].endswith('.jpg')]

print(jpg_links)

复制代码

这段代码首先使用requests库获取目标网页的HTML内容，然后使用BeautifulSoup解析HTML内容。接着，通过查找所有的img标签，并筛选出以.jpg结尾的链接，最后将这些链接打印出来。你可以根据实际需求对这段代码进行适当的修改。

账号		自动登录	找回密码
密码			立即注册