python爬到的内容不一致

qtyj123 · 发表于 2015-5-14 13:43:48

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import urllib.request as spider

url='http://jandan.net/ooxx'

req = spider.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36 SE 2.X MetaSr 1.0')
response = spider.urlopen(req)
html = response.read().decode('utf-8')

print(html)

a = html.find('current-comment-page') + 23
b = html.find(']',a)

print(html[a,b])

看了小甲鱼老师的，例子，就决定试一试，可是，最后没有结果，然后打印一下html发现和网页上审查元素里面element不一样，为什么？？？

qtyj123 · 发表于 2015-5-14 13:50:09

在线等，很急的，大家帮帮忙啊！！

z294354069 · 发表于 2015-5-15 13:41:44

用正则表达式去查找页数

dx4789 · 发表于 2015-5-15 14:20:10

得出的结果是什么，贴出来看看

账号		自动登录	找回密码
密码			立即注册