【爬虫相关问题】爬取图片时返回了一串神秘数字有啥含义吗?
import requestsfrom bs4 import BeautifulSoup
headers = {"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36"}
rq = requests.get("https://www.520jita.com/26060.html", headers = headers)
soup = BeautifulSoup(rq.content, 'lxml')
ls = soup.find("div", {"class":"context"})
img = ls.find_all('img')
url = []
for i in img:
url.append(i["src"])
count = 1
for img_url in url:
rq = requests.get(img_url, headers = headers).content
file_name = "好好_五月天吉他谱_" + str(count) + '.gif'
with open(file_name, 'wb') as f:
f.write(rq)
f.close()
count += 1
这串代码一共下载三张图片,在idle里面直接执行的时候,idle每下载完一个图片都会给我返回一串很迷的数字
请教各位大佬这个数字是什么意思。。 为什么要在>>>下做呢 wp231957 发表于 2020-3-25 18:35
为什么要在>>>下做呢
bs用的不熟,可以随时验证 hawzt1 发表于 2020-3-25 18:36
bs用的不熟,可以随时验证
>>>下即使不用print它也会有输出
那三个数字就是三个地址,具体是哪三个,你可以print测试一下 这个是21行 f.write(rq) 的返回值,也就是 rq 的长度。 我们单位一个网站,可以爬取关于某一个内容的所有信息吗 月明 发表于 2020-3-25 20:11
我们单位一个网站,可以爬取关于某一个内容的所有信息吗
这需要分析,如果是内网,就无法帮忙了 是单位建的网站,但普通人通过帐号在外网也可以登陆 月明 发表于 2020-3-26 13:20
是单位建的网站,但普通人通过帐号在外网也可以登陆
估计可爬,你自己研究研究吧 这是python写入文件时返回的值,应该是文件大小。 wp231957 发表于 2020-3-26 13:28
估计可爬,你自己研究研究吧
{:5_102:}
页:
[1]