鱼C论坛

 找回密码
 立即注册
查看: 734|回复: 4

[已解决]爬虫问题求助

[复制链接]
发表于 2018-12-9 20:13:09 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
爬取某网站的图片,错误信息如下,求大佬帮忙分析一下
  1. Traceback (most recent call last):
  2.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\urllib3\contrib\pyopenssl.py", line 453, in wrap_socket
  3.     cnx.do_handshake()
  4.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\OpenSSL\SSL.py", line 1907, in do_handshake
  5.     self._raise_ssl_error(self._ssl, result)
  6.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\OpenSSL\SSL.py", line 1632, in _raise_ssl_error
  7.     raise SysCallError(-1, "Unexpected EOF")
  8. OpenSSL.SSL.SysCallError: (-1, 'Unexpected EOF')

  9. During handling of the above exception, another exception occurred:

  10. Traceback (most recent call last):
  11.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\urllib3\connectionpool.py", line 600, in urlopen
  12.     chunked=chunked)
  13.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\urllib3\connectionpool.py", line 343, in _make_request
  14.     self._validate_conn(conn)
  15.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\urllib3\connectionpool.py", line 839, in _validate_conn
  16.     conn.connect()
  17.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\urllib3\connection.py", line 344, in connect
  18.     ssl_context=context)
  19.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\urllib3\util\ssl_.py", line 344, in ssl_wrap_socket
  20.     return context.wrap_socket(sock, server_hostname=server_hostname)
  21.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\urllib3\contrib\pyopenssl.py", line 459, in wrap_socket
  22.     raise ssl.SSLError('bad handshake: %r' % e)
  23. ssl.SSLError: ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)

  24. During handling of the above exception, another exception occurred:

  25. Traceback (most recent call last):
  26.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\requests\adapters.py", line 449, in send
  27.     timeout=timeout
  28.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\urllib3\connectionpool.py", line 638, in urlopen
  29.     _stacktrace=sys.exc_info()[2])
  30.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\urllib3\util\retry.py", line 398, in increment
  31.     raise MaxRetryError(_pool, url, error or ResponseError(cause))
  32. urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='data.whicdn.com', port=443): Max retries exceeded with url: /images/322761355/superthumb.jpg?t=1542973062 (Caused by SSLError(SSLError("bad handshake: SysCallError(-1, 'Unexpected EOF')",),))

  33. During handling of the above exception, another exception occurred:

  34. Traceback (most recent call last):
  35.   File "C:/Users/47689/Desktop/爬虫/Taylor.py", line 75, in <module>
  36.     main()
  37.   File "C:/Users/47689/Desktop/爬虫/Taylor.py", line 72, in main
  38.     save_imgs(img_urls, page)
  39.   File "C:/Users/47689/Desktop/爬虫/Taylor.py", line 48, in save_imgs
  40.     img = url_open(each_url,headers)
  41.   File "C:/Users/47689/Desktop/爬虫/Taylor.py", line 25, in url_open
  42.     web_data = requests.get(url,headers=headers,proxies=proxies)
  43.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\requests\api.py", line 75, in get
  44.     return request('get', url, params=params, **kwargs)
  45.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\requests\api.py", line 60, in request
  46.     return session.request(method=method, url=url, **kwargs)
  47.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\requests\sessions.py", line 533, in request
  48.     resp = self.send(prep, **send_kwargs)
  49.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\requests\sessions.py", line 646, in send
  50.     r = adapter.send(request, **kwargs)
  51.   File "C:\Users\47689\Documents\spider\venv\lib\site-packages\requests\adapters.py", line 514, in send
  52.     raise SSLError(e, request=request)
  53. requests.exceptions.SSLError: HTTPSConnectionPool(host='data.whicdn.com', port=443): Max retries exceeded with url: /images/322761355/superthumb.jpg?t=1542973062 (Caused by SSLError(SSLError("bad handshake: SysCallError(-1, 'Unexpected EOF')",),))
复制代码
最佳答案
2018-12-9 21:00:31
看报错,应该是你的证书有问题。  
地址应该是https开头的对吧??
想办法加上证书
不行的话,换其他方式或框架进行爬取
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-12-9 20:24:30 | 显示全部楼层
你上代码和你想爬取的网站吧
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-12-9 21:00:31 | 显示全部楼层    本楼为最佳答案   
看报错,应该是你的证书有问题。  
地址应该是https开头的对吧??
想办法加上证书
不行的话,换其他方式或框架进行爬取
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-12-10 09:46:34 | 显示全部楼层
wongyusing 发表于 2018-12-9 21:00
看报错,应该是你的证书有问题。  
地址应该是https开头的对吧??
想办法加上证书

https://weheartit.com/inspirations/taylorswift?
这个网站,不知道怎么加证书,我把verify设成False可以爬取一部分图片。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-12-10 11:43:47 | 显示全部楼层
sgsdg 发表于 2018-12-10 09:46
https://weheartit.com/inspirations/taylorswift?
这个网站,不知道怎么加证书,我把verify设成False可 ...

还有一种方法是,尝试把https的s去掉
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-17 13:49

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表