鱼C论坛

 找回密码
 立即注册
查看: 1143|回复: 2

如何把提取的图片链接保存到磁盘中

[复制链接]
发表于 2022-3-23 18:29:42 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
fjs.rar (75.67 KB, 下载次数: 1) 有7000多行,主要从中提取图片链接

import json
from pprint import pprint

import requests
我把txt文档中的内容复制过来,赋值给s。
jst=json.loads(s)
p_lst=[]
name_lst=[]
for i in jst:
    p_lst.append("https:"+i['pict_url'])
    name_lst.append(i['title'])
print(p_lst)
path=r'D:\Python\练习\爬虫'
j=0
for i in p_lst:
    with open(path+name_lst[j],'wb') as file:
        j+=1
        q = requests.get(i).content
        file.write(q)


然后有80多个图片链接,如何保存到新建路径文件夹磁盘中呢

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-3-25 10:29:48 | 显示全部楼层
保存链接地址的话可以考虑用json或者pickle,如果是保存图片的话用二进制写入就可以了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-3-25 15:22:16 | 显示全部楼层
本帖最后由 阿奇_o 于 2022-3-25 15:23 编辑
import json, requests, os 

with open('fjs.txt', mode='rb') as f:
    fjs = json.load(f)  # 
    imgs = ['https:'+ i['pict_url'] for i in fjs]
    # print(list(imgs))

    # 下载图片(以第一张图片为例)
    content = requests.get(imgs[0]).content

    # 保存图片
    img_name = os.path.basename(imgs[0])
    # print(img_name)
    path = r'.\imgs_download'  
    os.mkdir(path) if not os.path.exists(path) else None   # 若没该目录,就创建
    with open(os.path.join(path, img_name), mode='wb') as fi:
        fi.write(content)


    # ps: 改用异步来下载图片更快(具体自己搜)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-10-6 22:23

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表