鱼C论坛

 找回密码
 立即注册
查看: 3535|回复: 3

缩进中制表符和空格使用不一致

[复制链接]
发表于 2017-4-23 02:13:34 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import urllib.request
import re
import os



def get_page(url):#查找页面
            headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36'}
            req = urllib.request.Request(url, headers=headers)
            response = urllib.request.urlopen(req)
            html = response.read().decode('utf-8')
            p = r'<span class="current-comment-page">[(\d+?)]</span>'
               
            pages_addrs = re.findall(p, html)

            print(pages_addrs)
def find_img(url):
        pass
def save_img(img_addrs):
        pass
               
def download_mm(folder='ooxx', pages=10):
            os.mkdir(folder)
            os.chdir(folder)
            url = 'http://jandan.net/ooxx'
            page_num = int(get_page(url))
       
            for i in rangs(pages):
                page_num -= i
                page_url = url +'page-' + str(page_num) + '#comments'
                img_addrs = find_img(page_url)
                save_imgs(folder, img_addrs)
               
               
if __name__ == '__main__':
    download_mm()


这一段说缩进中制表符和空格使用不一致  p = r'<span class="current-comment-page">[(\d+?)]</span>'
不明白是哪里出错了
p = r'<span class="current-comment-page">\[(\d+?)\]</span>'这样也不可以  
很是疑惑
还望大佬们指教

谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-4-23 15:51:52 | 显示全部楼层
因为中括号在正则表达式里有含义
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-4-23 22:22:19 | 显示全部楼层
hldh214 发表于 2017-4-23 15:51
因为中括号在正则表达式里有含义

那要怎么办呢  加反斜杠也没用
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-4-23 23:01:03 | 显示全部楼层
见鲸 发表于 2017-4-23 22:22
那要怎么办呢  加反斜杠也没用

打印 html 看看不就知道了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-10-7 18:27

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表