鱼C论坛

 找回密码
 立即注册
查看: 1339|回复: 2

如何把提取的图片链接保存到磁盘中

[复制链接]
发表于 2022-3-23 18:29:42 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
fjs.rar (75.67 KB, 下载次数: 1) 有7000多行,主要从中提取图片链接

import json
from pprint import pprint

import requests
我把txt文档中的内容复制过来,赋值给s。
jst=json.loads(s)
p_lst=[]
name_lst=[]
for i in jst:
    p_lst.append("https:"+i['pict_url'])
    name_lst.append(i['title'])
print(p_lst)
path=r'D:\Python\练习\爬虫'
j=0
for i in p_lst:
    with open(path+name_lst[j],'wb') as file:
        j+=1
        q = requests.get(i).content
        file.write(q)


然后有80多个图片链接,如何保存到新建路径文件夹磁盘中呢

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-3-25 10:29:48 | 显示全部楼层
保存链接地址的话可以考虑用json或者pickle,如果是保存图片的话用二进制写入就可以了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-3-25 15:22:16 | 显示全部楼层
本帖最后由 阿奇_o 于 2022-3-25 15:23 编辑
  1. import json, requests, os

  2. with open('fjs.txt', mode='rb') as f:
  3.     fjs = json.load(f)  #
  4.     imgs = ['https:'+ i['pict_url'] for i in fjs]
  5.     # print(list(imgs))

  6.     # 下载图片(以第一张图片为例)
  7.     content = requests.get(imgs[0]).content

  8.     # 保存图片
  9.     img_name = os.path.basename(imgs[0])
  10.     # print(img_name)
  11.     path = r'.\imgs_download'  
  12.     os.mkdir(path) if not os.path.exists(path) else None   # 若没该目录,就创建
  13.     with open(os.path.join(path, img_name), mode='wb') as fi:
  14.         fi.write(content)


  15.     # ps: 改用异步来下载图片更快(具体自己搜)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-29 16:42

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表