鱼C论坛

 找回密码
 立即注册
查看: 3265|回复: 6

这是什么原因啊

[复制链接]
发表于 2016-8-7 21:15:27 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import urllib.request
import os

def get_page(url):
    req = urllib.request.Request(url)
    req.add_header('User-Agent','Mozilla/5.0 (Windows NT 5.1; rv:47.0) Gecko/20100101 Firefox/47.0')
    response = urllib.request.urlopen(url)
    html = response.read().decode('utf-8')

    a = html.find('current-comment-page')+23
    b = html.find(']',a)
    
    print(html[a:b])



def find_imgs(url):
    pass

def save_imgs(folder,img_addrs):
    pass


def download_mm(folder='OOXX',pages = 10):
    os.mkdir(folder)
    os.chdir(folder)

    url = "http://jandan.net/ooxx"
    page_num = int(get_page(url))

    for i in range(pages):
        page_num -= i
        page_url = url +'page-'+str(page_num)+'#comments'
        img_addrs = find_imgs(page_url)
        save_imgs(folder,img_addrs)

if __name__=='__main__':
    download_mm()
        
Traceback (most recent call last):
  File "E:\lorraine\01\Python\爬妹子图00.py", line 38, in <module>
    download_mm()
  File "E:\lorraine\01\Python\爬妹子图00.py", line 29, in download_mm
    page_num = int(get_page(url))
  File "E:\lorraine\01\Python\爬妹子图00.py", line 7, in get_page
    response = urllib.request.urlopen(url)
  File "C:\Python34\lib\urllib\request.py", line 161, in urlopen
    return opener.open(url, data, timeout)
  File "C:\Python34\lib\urllib\request.py", line 470, in open
    response = meth(req, response)
  File "C:\Python34\lib\urllib\request.py", line 580, in http_response
    'http', request, response, code, msg, hdrs)
  File "C:\Python34\lib\urllib\request.py", line 502, in error
    result = self._call_chain(*args)
  File "C:\Python34\lib\urllib\request.py", line 442, in _call_chain
    result = func(*args)
  File "C:\Python34\lib\urllib\request.py", line 685, in http_error_302
    return self.parent.open(new, timeout=req.timeout)
  File "C:\Python34\lib\urllib\request.py", line 470, in open
    response = meth(req, response)
  File "C:\Python34\lib\urllib\request.py", line 580, in http_response
    'http', request, response, code, msg, hdrs)
  File "C:\Python34\lib\urllib\request.py", line 508, in error
    return self._call_chain(*args)
  File "C:\Python34\lib\urllib\request.py", line 442, in _call_chain
    result = func(*args)
  File "C:\Python34\lib\urllib\request.py", line 588, in http_error_default
    raise HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError: HTTP Error 503: Service Temporarily Unavailable
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-8-7 21:17:32 | 显示全部楼层
urllib.error.HTTPError: HTTP Error 503: Service Temporarily Unavailable
是不是网站没有响应?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-8-7 21:53:06 | 显示全部楼层
sunqiangzai 发表于 2016-8-7 21:17
urllib.error.HTTPError: HTTP Error 503: Service Temporarily Unavailable
是不是网站没有响应?

我也不知道,用浏览器又可以打开
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-8-7 22:04:06 | 显示全部楼层
好巧我也正学到这一节,也是503错误
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-8-7 22:29:35 | 显示全部楼层
云飘飘 发表于 2016-8-7 22:04
好巧我也正学到这一节,也是503错误

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-4-24 10:57:16 | 显示全部楼层
设置一个模拟浏览器,还有ip地址也代理一个
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-4-24 11:03:53 | 显示全部楼层
https://baike.baidu.com/item/503错误/1827145
服务器出错。类似404NOT FOUND就是。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-2-7 17:36

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表