关于图片格式抓取问题？,萌新交流区,萌新训练营,鱼C论坛

zyj1214 发表于 2023-11-15 20:10:57

关于图片格式抓取问题？

怎么抓取网页src图片链接时，只提取 .jpg格式，，不提取.png格式。。用代码怎么实现？

isdkz 发表于 2023-11-15 20:11:07

你可以使用Python中的BeautifulSoup和requests库来实现这个功能。首先，你需要使用requests库来获取网页的HTML内容，然后使用BeautifulSoup来解析HTML内容并提取图片链接。接着，你可以使用Python的字符串处理功能来筛选出以.jpg结尾的链接。下面是一个简单的示例代码：

import requests
from bs4 import BeautifulSoup

url = '你的目标网页链接'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

img_tags = soup.find_all('img')
jpg_links = for img in img_tags if img['src'].endswith('.jpg')]

print(jpg_links)

这段代码首先使用requests库获取目标网页的HTML内容，然后使用BeautifulSoup解析HTML内容。接着，通过查找所有的img标签，并筛选出以.jpg结尾的链接，最后将这些链接打印出来。你可以根据实际需求对这段代码进行适当的修改。

页: [1]

鱼C论坛's Archiver

关于图片格式抓取问题？