鱼C论坛

 找回密码
 立即注册
查看: 2462|回复: 4

爬虫--urlopen出现timeout等错误

[复制链接]
发表于 2017-8-10 22:05:18 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
#为了突出问题,把ip代理部分代码删除了
def Agent_response(url):
    rsp = request.urlopen(url,timeout = 8)
    html = rsp.read().decode('utf-8')
    js = json.loads(html)         
    return js

出现的错误有:
        1.time out
        2.URLError: <urlopen error Remote end closed connection without response>
        3.由于目标计算机积极拒绝,无法连接

个人推测:
               网络不稳定的问题,但是用浏览器打的开网页。纠结的啊

url 网址实例:
https://maps.googleapis.com/maps/api/place/search/json?location=41.935385,-87.696485&radius=1000&sensor=true&key=AIzaSyBMGzm-1zXeLX-QNi9N7ozRJWZlREyYEe4&types=accounting

程序访问google map api爬取数据

各位路过大佬求指导指导,互相学习,叩谢。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-8-10 22:40:06 | 显示全部楼层
浏览器能打的开网页,说明服务器有判断;
给个 header 处理下应该就可以了。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-8-11 09:54:17 | 显示全部楼层
ba21 发表于 2017-8-10 22:40
浏览器能打的开网页,说明服务器有判断;
给个 header 处理下应该就可以了。

为什么我单独弄urllib.rrquest.urlopen('http://www.baidu.com') 都出不来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-8-11 10:37:18 | 显示全部楼层
先去掉代理,再添加header试试。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-8-12 10:50:35 | 显示全部楼层
hustlin 发表于 2017-8-11 10:37
先去掉代理,再添加header试试。

还是不行,但是打开http站点就很快,而https站点很慢,甚至超时
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-2-24 11:21

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表