Requests库5个入门案例展示

TommyTimfy · 发表于 2017-8-29 19:11:48

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由 TommyTimfy 于 2017-8-31 23:16 编辑

注：
本帖系鄙人在别处学习总结得来，但是符合小甲鱼老师的笔记规矩。
尊重下版权注明下出处：中国大学MOOC，Python网络爬虫与信息的获取
均在IDLE上运行即可。

复制代码

第二个例子是亚马逊网站，若采用上述方法，则会出现“意外错误”。这里需要修改下user-agent，改为Mozilla/5.0，就可以访问了

复制代码

百度的关键词接口：https://www.baidu.com/s?wd=keyword
这里我们尝试返回输入Python时的内容。

复制代码

这里我们找到了一个可以查询归属地的网站，进去搜了一个之后，了解其格式，为：
http://www.ip138.com:8080/search ... 8&action=mobile，因此代码稍作修改，即可实现：

复制代码

网络图片的爬取：
思路：用到了os模块的一些命令，若没有指定的文件夹，则会创建文件夹，并在其中保存图片。

# 网页图片爬取,并保存其在网页上的图片名
import requests
import os
url = 'http://img0.dili360.com/rw14/ga/M02/33/7C/wKgBzFSbqQyAJVAuAARB8cSWH_w695.tub.jpg'
root = "E://XXX//XXX" # 根目录地址，自己定一个
path = root + url.split('/')[-1] # 完整路径+图片名
try:
if not os.path.exists(root):
os.mkdir(root) # 创建单层目录
if not os.path.exists(path):
r = requests.get(url)
with open(path, 'wb') as f:
f.write(r.content) # 默认二进制形式写入文件
f.close()
print("Saved successfully!")
else:
print("The file already exists.")
except:
print("Error Occurred")

复制代码

ド゛゜范 · 发表于 2017-8-29 19:15:23

谢谢了

ド゛゜范 · 发表于 2017-8-29 19:16:36

with是默认关闭的

不用写close

TommyTimfy · 发表于 2017-8-29 20:33:01

ド゛゜范发表于 2017-8-29 19:16
with是默认关闭的不用写close

哈哈多谢提醒

新手·ing · 发表于 2017-8-29 21:46:16

能不能写注释，不是很懂一些函数

TommyTimfy · 发表于 2017-8-30 15:01:45

新手·ing 发表于 2017-8-29 21:46
能不能写注释，不是很懂一些函数

请问是在评论里写吗？或者可以直接修改帖子吗？

新手·ing · 发表于 2017-8-30 16:50:16

TommyTimfy 发表于 2017-8-30 15:01
请问是在评论里写吗？或者可以直接修改帖子吗？

修改呗，我觉得挺好的

TommyTimfy · 发表于 2017-8-31 23:17:13

新手·ing 发表于 2017-8-30 16:50
修改呗，我觉得挺好的

啊，回复晚了，我做好补充了

账号		自动登录	找回密码
密码			立即注册

[技术交流] Requests库5个入门案例展示