[已解决]python爬取图片

tengke · 发表于 2024-3-13 17:01:07

view-source:https://desk.zol.com.cn/bizhi/10053_120319_2.html
这个地址有个轮询的图片
一共有11张我可以用re.get获取对应的源代码进行find过滤出来

但是如果不使用过滤的这个方法要怎么获取其他的图片jpg呢

最佳答案

月排行榜 / 总排行榜

FishC

2024-3-13 17:01:08

如果您不想使用正则表达式来过滤获取图片地址，可以使用BeautifulSoup库来解析网页，并提取所有的img标签中的图片地址。以下是一种实现方式：

import requests
from bs4 import BeautifulSoup
url = "https://desk.zol.com.cn/bizhi/10053_120319_2.html"
# 发送请求并获取页面内容
response = requests.get(url)
html = response.text
# 使用BeautifulSoup解析网页
soup = BeautifulSoup(html, "html.parser")
# 提取所有的img标签
img_tags = soup.find_all("img")
# 遍历img标签，并打印图片地址
for img_tag in img_tags:
src = img_tag["src"]
if src.endswith(".jpg"):
print(src)

复制代码

这段代码首先使用`requests`库发送GET请求，获取网页内容。然后使用`BeautifulSoup`库对网页进行解析，得到一个`BeautifulSoup`对象`soup`。我们通过调用`soup`对象的`find_all`方法，传入标签名"img"，即可获取所有的img标签。接下来，遍历这些img标签，通过索引获取属性"src"的值，即图片的地址。最后，使用`endswith`方法判断该地址是否以".jpg"结尾，如果是，则打印出来。

请注意，对于不同的网页，需要根据实际情况调整代码，例如可能存在其他属性名称如"data-src"或"srcset"来存储图片地址。此外，爬取网页上的图片需要遵守相关法律法规和网站的使用规定。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

跳转到最佳答案楼层

FishC · 发表于 2024-3-13 17:01:08

如果您不想使用正则表达式来过滤获取图片地址，可以使用BeautifulSoup库来解析网页，并提取所有的img标签中的图片地址。以下是一种实现方式：

import requests
from bs4 import BeautifulSoup
url = "https://desk.zol.com.cn/bizhi/10053_120319_2.html"
# 发送请求并获取页面内容
response = requests.get(url)
html = response.text
# 使用BeautifulSoup解析网页
soup = BeautifulSoup(html, "html.parser")
# 提取所有的img标签
img_tags = soup.find_all("img")
# 遍历img标签，并打印图片地址
for img_tag in img_tags:
src = img_tag["src"]
if src.endswith(".jpg"):
print(src)

复制代码

这段代码首先使用`requests`库发送GET请求，获取网页内容。然后使用`BeautifulSoup`库对网页进行解析，得到一个`BeautifulSoup`对象`soup`。我们通过调用`soup`对象的`find_all`方法，传入标签名"img"，即可获取所有的img标签。接下来，遍历这些img标签，通过索引获取属性"src"的值，即图片的地址。最后，使用`endswith`方法判断该地址是否以".jpg"结尾，如果是，则打印出来。

请注意，对于不同的网页，需要根据实际情况调整代码，例如可能存在其他属性名称如"data-src"或"srcset"来存储图片地址。此外，爬取网页上的图片需要遵守相关法律法规和网站的使用规定。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

账号		自动登录	找回密码
密码			立即注册