[已解决]如何批量生成自定义文件名

qzk122 · 发表于 2019-12-20 23:14:19

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import urllib.request

n = 500
m = 600
while n <600:

dizhi = ("http://placekitten.com/{}/{}" .format(str(n),str(m)))

response = urllib.request.urlopen(str(dizhi))

cat_img = response.read()

with open("cat-500-600.jpg","wb")as f:
      f.write(cat_img)
n+=2
m+=2

  看了小甲鱼的爬猫那一节视频后，自己想着能不能批量爬取，但是被照片命名给难倒了。求大佬指教一下萌新，十分感谢。

最佳答案

月排行榜 / 总排行榜

hrp

2019-12-21 01:04:16

本帖最后由 hrp 于 2019-12-21 01:10 编辑

用n m 当做文件名一部分就可以了嘛，其实有很多办法的
试了一下时快时慢，不知道是我网太慢了还是啥原因

import urllib.request
n = 500
m = 600
while n <600:
dizhi = f"http://placekitten.com/{n}/{m}"
response = urllib.request.urlopen(dizhi)
cat_img = response.read()
with open(f"cat-{n}-{m}.jpg","wb") as f:
f.write(cat_img)
n += 2
m += 2

复制代码

跳转到最佳答案楼层

hrp · 发表于 2019-12-21 01:04:16

本帖最后由 hrp 于 2019-12-21 01:10 编辑

用n m 当做文件名一部分就可以了嘛，其实有很多办法的
试了一下时快时慢，不知道是我网太慢了还是啥原因

import urllib.request
n = 500
m = 600
while n <600:
dizhi = f"http://placekitten.com/{n}/{m}"
response = urllib.request.urlopen(dizhi)
cat_img = response.read()
with open(f"cat-{n}-{m}.jpg","wb") as f:
f.write(cat_img)
n += 2
m += 2

复制代码

Stubborn · 发表于 2019-12-21 02:56:45

对名字没有要求，可以设置一个全局变量，每下载完一张图片，全局变量+1 ，用全局变量来命名图片

qzk122 · 发表于 2019-12-21 12:07:34

hrp 发表于 2019-12-21 01:04
用n m 当做文件名一部分就可以了嘛，其实有很多办法的
试了一下时快时慢，不知道是我网太慢了还是啥原因

谢谢大佬，文件名字已经解决了。可是确实运行之后图片下载速度很慢，每次只能下载四五张。

qzk122 · 发表于 2019-12-21 12:13:18

Stubborn 发表于 2019-12-21 02:56
对名字没有要求，可以设置一个全局变量，每下载完一张图片，全局变量+1 ，用全局变量来命名图片

谢谢大佬，我能想设一个全局变量，但是无从下手，毕竟我还是只是萌新>_<.能不能再指教一下。嗯....还有就是名字问题解决之后还有下载速度问题，每次运行都下载速度很慢，好久都没反应。最多的一次也就五六张。

Stubborn · 发表于 2019-12-21 16:04:39

本帖最后由 Stubborn 于 2019-12-21 16:06 编辑

import urllib.request
page = 0
n = 500
m = 600
while n <600:
dizhi = f"http://placekitten.com/{n}/{m}"
response = urllib.request.urlopen(dizhi)
cat_img = response.read()
name = f"{page}.jpg"
with open(name,"wb") as f:
f.write(cat_img)
page +=1
n += 2
m += 2

复制代码

网络慢没有办法，因为是国外的网站，响应可能不是那么好

hrp · 发表于 2019-12-21 17:50:59

qzk122 发表于 2019-12-21 12:13
谢谢大佬，我能想设一个全局变量，但是无从下手，毕竟我还是只是萌新>_

伪装浏览器访问，显著变快。应该是网站对爬虫做了一定限制。

import urllib.request
n = 600
m = 600
while n <700:
dizhi = f"http://placekitten.com/g/{n}/{m}"
req = urllib.request.Request(dizhi)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36')
response = urllib.request.urlopen(req)
cat_img = response.read()
with open(f"cat-{n}-{m}.jpg","wb") as f:
f.write(cat_img)
n += 10
m += 10

复制代码

账号		自动登录	找回密码
密码			立即注册

[已解决]如何批量生成自定义文件名

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块