鱼C论坛

 找回密码
 立即注册
查看: 2777|回复: 4

python3中xpath怎么使用

[复制链接]
发表于 2017-6-12 11:23:31 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import urllib.request

url = 'http://tieba.baidu.com/p/5148091325'

response = urllib.request.urlopen(url)

html = response.xpath('//*[@id="post_content_108012954576"]/text()')

print(html)

报错信息:Traceback (most recent call last):
  File "C:\Users\memedai\Desktop\xpath.py", line 7, in <module>
    html = response.xpath('//*[@id="post_content_108012954576"]/text()')
AttributeError: 'HTTPResponse' object has no attribute 'xpath'
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-6-12 11:57:52 | 显示全部楼层
lxml
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-6-12 14:05:33 | 显示全部楼层
bs4 的BeautifulSoup才有xpath
又不是Python自带的,你直接肯定用不了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

发表于 2017-6-12 15:59:07 | 显示全部楼层
楼上正解
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-6-13 20:38:36 | 显示全部楼层
你得先装上lxml,安装过程可能有障碍,具体可以百度或者知乎.
给个网址,我一开始是按照这个说明安装成功的
https://www.zhihu.com/question/49470061/answer/116163941

后来其实有更简单的方法,假如你有使用pycharm的情况下.
settings→ Project →  Interpretre ,看到右边绿色那个加号了没有?
对,点进去然后寻找把,各种库都在这里了.
并且装完还自动把语法提示都有了.

然后 xpath方法在lxml里面.

楼上也说了,BeautifulSoup,它也需要lxml解析

或许你学了BeautifulSoup就不想用lxml了.
但是lxml对于单一网页还是有奇效的,至少解析速度快一点点.
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-2-14 05:41

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表