鱼C论坛

 找回密码
 立即注册
查看: 919|回复: 1

[已解决]python爬取图片

[复制链接]
发表于 2024-3-13 17:01:07 | 显示全部楼层 |阅读模式
1鱼币
view-source:https://desk.zol.com.cn/bizhi/10053_120319_2.html
这个地址有个轮询的图片
一共有11张  我可以用re.get获取对应的源代码 进行find过滤出来

但是如果不使用过滤的这个方法要怎么获取其他的图片jpg呢
最佳答案
2024-3-13 17:01:08
如果您不想使用正则表达式来过滤获取图片地址,可以使用BeautifulSoup库来解析网页,并提取所有的img标签中的图片地址。以下是一种实现方式:
import requests
from bs4 import BeautifulSoup

url = "https://desk.zol.com.cn/bizhi/10053_120319_2.html"

# 发送请求并获取页面内容
response = requests.get(url)
html = response.text

# 使用BeautifulSoup解析网页
soup = BeautifulSoup(html, "html.parser")

# 提取所有的img标签
img_tags = soup.find_all("img")

# 遍历img标签,并打印图片地址
for img_tag in img_tags:
    src = img_tag["src"]
    if src.endswith(".jpg"):
        print(src)

这段代码首先使用`requests`库发送GET请求,获取网页内容。然后使用`BeautifulSoup`库对网页进行解析,得到一个`BeautifulSoup`对象`soup`。我们通过调用`soup`对象的`find_all`方法,传入标签名"img",即可获取所有的img标签。接下来,遍历这些img标签,通过索引获取属性"src"的值,即图片的地址。最后,使用`endswith`方法判断该地址是否以".jpg"结尾,如果是,则打印出来。

请注意,对于不同的网页,需要根据实际情况调整代码,例如可能存在其他属性名称如"data-src"或"srcset"来存储图片地址。此外,爬取网页上的图片需要遵守相关法律法规和网站的使用规定。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

最佳答案

查看完整内容

如果您不想使用正则表达式来过滤获取图片地址,可以使用BeautifulSoup库来解析网页,并提取所有的img标签中的图片地址。以下是一种实现方式: 这段代码首先使用`requests`库发送GET请求,获取网页内容。然后使用`BeautifulSoup`库对网页进行解析,得到一个`BeautifulSoup`对象`soup`。我们通过调用`soup`对象的`find_all`方法,传入标签名"img",即可获取所有的img标签。接下来,遍历这些img标签,通过索引获取属性"src"的 ...
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-3-13 17:01:08 | 显示全部楼层    本楼为最佳答案   
如果您不想使用正则表达式来过滤获取图片地址,可以使用BeautifulSoup库来解析网页,并提取所有的img标签中的图片地址。以下是一种实现方式:
import requests
from bs4 import BeautifulSoup

url = "https://desk.zol.com.cn/bizhi/10053_120319_2.html"

# 发送请求并获取页面内容
response = requests.get(url)
html = response.text

# 使用BeautifulSoup解析网页
soup = BeautifulSoup(html, "html.parser")

# 提取所有的img标签
img_tags = soup.find_all("img")

# 遍历img标签,并打印图片地址
for img_tag in img_tags:
    src = img_tag["src"]
    if src.endswith(".jpg"):
        print(src)

这段代码首先使用`requests`库发送GET请求,获取网页内容。然后使用`BeautifulSoup`库对网页进行解析,得到一个`BeautifulSoup`对象`soup`。我们通过调用`soup`对象的`find_all`方法,传入标签名"img",即可获取所有的img标签。接下来,遍历这些img标签,通过索引获取属性"src"的值,即图片的地址。最后,使用`endswith`方法判断该地址是否以".jpg"结尾,如果是,则打印出来。

请注意,对于不同的网页,需要根据实际情况调整代码,例如可能存在其他属性名称如"data-src"或"srcset"来存储图片地址。此外,爬取网页上的图片需要遵守相关法律法规和网站的使用规定。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-23 10:10

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表