鱼C论坛

 找回密码
 立即注册
查看: 1665|回复: 10

【爬虫相关问题】爬取图片时返回了一串神秘数字有啥含义吗?

[复制链接]
发表于 2020-3-25 18:11:13 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import requests
  2. from bs4 import BeautifulSoup

  3. headers = {"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36"}

  4. rq = requests.get("https://www.520jita.com/26060.html", headers = headers)
  5. soup = BeautifulSoup(rq.content, 'lxml')
  6. ls = soup.find("div", {"class":"context"})
  7. img = ls.find_all('img')

  8. url = []
  9. for i in img:
  10.     url.append(i["src"])

  11. count = 1

  12. for img_url in url:
  13.     rq = requests.get(img_url, headers = headers).content
  14.     file_name = "好好_五月天吉他谱_" + str(count) + '.gif'
  15.     with open(file_name, 'wb') as f:
  16.             f.write(rq)
  17.     f.close()
  18.     count += 1
复制代码


这串代码一共下载三张图片,在idle里面直接执行的时候,idle每下载完一个图片都会给我返回一串很迷的数字
QQ图片20200325181034.png

请教各位大佬这个数字是什么意思。。
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-3-25 18:35:11 From FishC Mobile | 显示全部楼层
为什么要在>>>下做呢
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-25 18:36:47 | 显示全部楼层
wp231957 发表于 2020-3-25 18:35
为什么要在>>>下做呢

bs用的不熟,可以随时验证
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-25 18:39:27 From FishC Mobile | 显示全部楼层
hawzt1 发表于 2020-3-25 18:36
bs用的不熟,可以随时验证

>>>下即使不用print它也会有输出
那三个数字就是三个地址,具体是哪三个,你可以print测试一下
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-25 19:45:10 | 显示全部楼层
这个是21行 f.write(rq) 的返回值,也就是 rq 的长度。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-25 20:11:35 | 显示全部楼层
我们单位一个网站,可以爬取关于某一个内容的所有信息吗
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-25 20:30:22 From FishC Mobile | 显示全部楼层
月明 发表于 2020-3-25 20:11
我们单位一个网站,可以爬取关于某一个内容的所有信息吗

这需要分析,如果是内网,就无法帮忙了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-26 13:20:47 | 显示全部楼层
是单位建的网站,但普通人通过帐号在外网也可以登陆
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-26 13:28:00 From FishC Mobile | 显示全部楼层
月明 发表于 2020-3-26 13:20
是单位建的网站,但普通人通过帐号在外网也可以登陆

估计可爬,你自己研究研究吧
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-26 15:54:18 | 显示全部楼层
这是python写入文件时返回的值,应该是文件大小。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-27 08:55:43 | 显示全部楼层
wp231957 发表于 2020-3-26 13:28
估计可爬,你自己研究研究吧

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-9 03:35

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表