|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
import csv
import requests
# 文件路径
file_rode = '/Users/yangxiaolong/Downloads/1.csv'
# 打开文件
csv_file = csv.reader(open(file_rode, 'r', encoding='utf-8'))
# 跳过标题行
next(csv_file, None)
# 可以先用下面注释里的语句看看你文件中的URL取出来之后是什么格式的
# for url in csv_file:
# print(url)
# 接着对里边的每一条链接做如下操作
for url in csv_file:
# 这里需要注意的是要将取出来的URL做一个字符串类型转换,并截取其中的link的部分
r = requests.get(str(url)[2:101])
music = r.content
# 目标路径需要换成你自己的路径,str(url)[90:-2]这个的意思是给文件命名
new_url = "/Users/yangxiaolong/Downloads/1/" + str(url)[90:-2]
# 下面是将文件以二进制的形式写入到目标文件中
with open(new_url, 'ab') as file:
file.write(music)
file.flush
本帖最后由 suchocolate 于 2020-6-25 17:34 编辑
由于没有你的csv,我用你说的内容做的csv文件,然后爬取正常。 - import requests
- import csv
- headers = {'user-agent': 'firefox'}
- with open('test.csv', 'r', encoding='utf-8') as csvfile:
- reader = csv.reader(csvfile)
- for row in reader:
- print(row)
- r = requests.get(row[0], headers=headers)
- with open(row[1] + '.jpg','wb') as f:
- f.write(r.content)
- print(row[1] + '下载完成。')
复制代码
|
|