[已解决]求助，为什么我下载出来的格式不是jpg？怎么改

Young少帅 · 发表于 2020-6-18 15:35:08

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import csv
import requests

# 文件路径
file_rode = '/Users/yangxiaolong/Downloads/1.csv'
# 打开文件
csv_file = csv.reader(open(file_rode, 'r', encoding='utf-8'))
# 跳过标题行
next(csv_file, None)

# 可以先用下面注释里的语句看看你文件中的URL取出来之后是什么格式的
# for url in csv_file:
#    print(url)

# 接着对里边的每一条链接做如下操作
for url in csv_file:
# 这里需要注意的是要将取出来的URL做一个字符串类型转换，并截取其中的link的部分
r = requests.get(str(url)[2:101])
music = r.content
# 目标路径需要换成你自己的路径，str(url)[90:-2]这个的意思是给文件命名
new_url = "/Users/yangxiaolong/Downloads/1/" + str(url)[90:-2]
# 下面是将文件以二进制的形式写入到目标文件中
with open(new_url, 'ab') as file:
      file.write(music)
      file.flush

最佳答案

月排行榜 / 总排行榜

suchocolate

2020-6-25 17:30:54

本帖最后由 suchocolate 于 2020-6-25 17:34 编辑

Young少帅发表于 2020-6-25 16:00
A ...

由于没有你的csv，我用你说的内容做的csv文件，然后爬取正常。

import requests
import csv
headers = {'user-agent': 'firefox'}
with open('test.csv', 'r', encoding='utf-8') as csvfile:
reader = csv.reader(csvfile)
for row in reader:
print(row)
r = requests.get(row[0], headers=headers)
with open(row[1] + '.jpg','wb') as f:
f.write(r.content)
print(row[1] + '下载完成。')

复制代码

跳转到最佳答案楼层

xcsummer · 发表于 2020-6-18 15:57:22

最后写入的时候是wb吧，ab是啥？

Young少帅 · 发表于 2020-6-19 14:22:14

xcsummer 发表于 2020-6-18 15:57
最后写入的时候是wb吧，ab是啥？

我也不知道在网上找的别人做好的我不会做全新菜鸟 ab我也不知道是啥 wb 也不行下载出来都是文件编辑文稿

suchocolate · 发表于 2020-6-19 14:52:26

csv内容是啥

Young少帅 · 发表于 2020-6-20 14:38:52

suchocolate 发表于 2020-6-19 14:52
csv内容是啥

一共两列第一列是jpg结尾的图片链接第二列是这个图片要改的名称

suchocolate · 发表于 2020-6-20 16:41:45

Young少帅发表于 2020-6-20 14:38
一共两列第一列是jpg结尾的图片链接第二列是这个图片要改的名称

麻烦分享一下csv文件

Young少帅 · 发表于 2020-6-25 15:52:19

suchocolate 发表于 2020-6-19 14:52
csv内容是啥

suchocolate 发表于 2020-6-19 14:52
csv内容是啥

一共两列第一列是jpg结尾的图片链接第二列是这个图片要改的名称

Young少帅 · 发表于 2020-6-25 15:53:18

suchocolate 发表于 2020-6-20 16:41
麻烦分享一下csv文件

/Users/yangxiaolong/Downloads/1.csv

Young少帅 · 发表于 2020-6-25 16:00:04

suchocolate 发表于 2020-6-19 14:52
csv内容是啥

A                                                                                                                                        B
http://pic.cdfgsanya.com/assets/ ... ac7df8b07950352.jpg C024746
http://pic.cdfgsanya.com/assets/ ... 34a588313bafda6.jpg C034946
http://pic.cdfgsanya.com/assets/ ... 9ad6cf218812999.jpg C037734
http://pic.cdfgsanya.com/assets/ ... 8e90eebdbaff210.jpg          C037735
http://pic.cdfgsanya.com/assets/ ... e3eec029d638e4a.jpg C038020
http://pic.cdfgsanya.com/assets/ ... d5b2a384c5cfd9d.jpg             C038131
http://pic.cdfgsanya.com/assets/ ... 87599fb8556333d.jpg C038320

一共AB两列就是想让python帮我把表格里的图片下载好改成后面对应的名字存起来

suchocolate · 发表于 2020-6-25 17:30:54

这个最佳答案由 suchocolate 给出，感谢 suchocolate 的回答。

单击隐藏图章

本帖最后由 suchocolate 于 2020-6-25 17:34 编辑

Young少帅发表于 2020-6-25 16:00
A ...

由于没有你的csv，我用你说的内容做的csv文件，然后爬取正常。

import requests
import csv
headers = {'user-agent': 'firefox'}
with open('test.csv', 'r', encoding='utf-8') as csvfile:
reader = csv.reader(csvfile)
for row in reader:
print(row)
r = requests.get(row[0], headers=headers)
with open(row[1] + '.jpg','wb') as f:
f.write(r.content)
print(row[1] + '下载完成。')

复制代码

Young少帅 · 发表于 2020-6-26 21:18:31

我还是弄不好？能加个微信吗我跟您好好探讨为什么我不能用

suchocolate · 发表于 2020-6-27 10:43:28

Young少帅发表于 2020-6-26 21:18
我还是弄不好？能加个微信吗我跟您好好探讨为什么我不能用

你把你的csv分享出来吧，百度网盘或腾讯文档都可以。

Young少帅 · 发表于 2020-6-30 13:34:04

suchocolate 发表于 2020-6-27 10:43
你把你的csv分享出来吧，百度网盘或腾讯文档都可以。

就是两列一列是http://pic.cdfgsanya.com/assets/ ... ac7df8b07950352.jpg
另一列是C00000

suchocolate · 发表于 2020-6-30 16:58:51

Young少帅发表于 2020-6-30 13:34
就是两列一列是http://pic.cdfgsanya.com/assets/upload/product/73e4422f19d564663ac7df8b07950352.jpg
...

excel打开和用csv打开是不一样的，你把文件分享出来，让我们看看实际内容。
光说你看到的，但是实际python打开不一样，代码就跑步起来。
你还是分享文档吧。

账号		自动登录	找回密码
密码			立即注册