hawzt1 发表于 2020-3-25 18:11:13

【爬虫相关问题】爬取图片时返回了一串神秘数字有啥含义吗?

import requests
from bs4 import BeautifulSoup

headers = {"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36"}

rq = requests.get("https://www.520jita.com/26060.html", headers = headers)
soup = BeautifulSoup(rq.content, 'lxml')
ls = soup.find("div", {"class":"context"})
img = ls.find_all('img')

url = []
for i in img:
    url.append(i["src"])

count = 1

for img_url in url:
    rq = requests.get(img_url, headers = headers).content
    file_name = "好好_五月天吉他谱_" + str(count) + '.gif'
    with open(file_name, 'wb') as f:
            f.write(rq)
    f.close()
    count += 1


这串代码一共下载三张图片,在idle里面直接执行的时候,idle每下载完一个图片都会给我返回一串很迷的数字


请教各位大佬这个数字是什么意思。。

wp231957 发表于 2020-3-25 18:35:11

为什么要在>>>下做呢

hawzt1 发表于 2020-3-25 18:36:47

wp231957 发表于 2020-3-25 18:35
为什么要在>>>下做呢

bs用的不熟,可以随时验证

wp231957 发表于 2020-3-25 18:39:27

hawzt1 发表于 2020-3-25 18:36
bs用的不熟,可以随时验证

>>>下即使不用print它也会有输出
那三个数字就是三个地址,具体是哪三个,你可以print测试一下

永恒的蓝色梦想 发表于 2020-3-25 19:45:10

这个是21行 f.write(rq) 的返回值,也就是 rq 的长度。

月明 发表于 2020-3-25 20:11:35

我们单位一个网站,可以爬取关于某一个内容的所有信息吗

wp231957 发表于 2020-3-25 20:30:22

月明 发表于 2020-3-25 20:11
我们单位一个网站,可以爬取关于某一个内容的所有信息吗

这需要分析,如果是内网,就无法帮忙了

月明 发表于 2020-3-26 13:20:47

是单位建的网站,但普通人通过帐号在外网也可以登陆

wp231957 发表于 2020-3-26 13:28:00

月明 发表于 2020-3-26 13:20
是单位建的网站,但普通人通过帐号在外网也可以登陆

估计可爬,你自己研究研究吧

科技爱好者 发表于 2020-3-26 15:54:18

这是python写入文件时返回的值,应该是文件大小。

月明 发表于 2020-3-27 08:55:43

wp231957 发表于 2020-3-26 13:28
估计可爬,你自己研究研究吧

{:5_102:}
页: [1]
查看完整版本: 【爬虫相关问题】爬取图片时返回了一串神秘数字有啥含义吗?