yhhpf 发表于 2020-6-23 14:12:51

爬虫下载的问题~

才刚学习python不久,前面学了点爬虫的知识,但是没碰到这种链接一打开直接下载的我有点懵逼了,需要怎么处理?

大佬们可以看下附件,url是保存在excel表格里的,用“,”隔开的最后一段就是下载url,需要怎样才能实现自动获取地址后直接另存到当前目录呢?

{:5_100:}

yhhpf 发表于 2020-6-23 14:15:35

@Twilight6 {:10_254:}

Twilight6 发表于 2020-6-23 14:28:44



嘿嘿 我也没怎么爬过这种情况的

你最后一句是什么意思,有点没懂{:10_297:}

yhhpf 发表于 2020-6-23 14:35:22

Twilight6 发表于 2020-6-23 14:28
嘿嘿 我也没怎么爬过这种情况的

你最后一句是什么意思,有点没懂

额...我应该直接把链接放出来的...附件里就是源文件的excel表格,放链接的表。链接:(这链接打开直接就下载的,搞不来...)
http://wms-historydata.oss-cn-hangzhou.aliyuncs.com/2019-08%E2%80%942019-08-f83m8dq-%E5%8F%91%E8%B4%A7%E4%BB%BB%E5%8A%A1.xlsx?Expires=1907374362&OSSAccessKeyId=LTAIzPBiAU1LOuHi&Signature=RVlU0uicHuwm4h%2B4SMOMucCtr%2FQ%3D

Twilight6 发表于 2020-6-23 14:35:29


是这样的嘛?把文件下载下来了?你运行下代码看看你目录下就有text.xlsx 文件了~

import requests

url = 'http://wms-historydata.oss-cn-hangzhou.aliyuncs.com/2019-08%E2%80%942019-08-f83m8dq-%E5%8F%91%E8%B4%A7%E4%BB%BB%E5%8A%A1.xlsx?Expires=1907374362&OSSAccessKeyId=LTAIzPBiAU1LOuHi&Signature=RVlU0uicHuwm4h%2B4SMOMucCtr%2FQ%3D'
html = requests.get(url)
with open('test.xlsx','wb') as f:
    f.write(html.content)

yhhpf 发表于 2020-6-23 14:43:44

Twilight6 发表于 2020-6-23 14:35
是这样的嘛?把文件下载下来了?你运行下代码看看你目录下就有text.xlsx 文件了~

大佬666...原来直接写就好了么...我还F12看半天看不出啥T-T...

Twilight6 发表于 2020-6-23 14:45:10

yhhpf 发表于 2020-6-23 14:43
大佬666...原来直接写就好了么...我还F12看半天看不出啥T-T...

    我也第一次尝试,学习到了
页: [1]
查看完整版本: 爬虫下载的问题~