可以发现只有这些图片链接的后面是width="165" height="117",所以可以根据这个,代码如下:import requests
import re
if __name__ == "__main__":
url = 'http://www.jkl.com.cn/cn/phoLis.aspx?id=697'
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.92 Safari/537.36'}
# 使用通过爬虫对url对应的一整张页面进行爬取
page_text = requests.get(url=url,headers=headers).text
# 使用聚焦爬虫将页面中所有的图片进行解析/提取
img_src_list = re.findall(r'(?<=\<img src\=").+(?=" width="165" height="117")',page_text,re.S)
print(img_src_list)
|