鱼C论坛

 找回密码
 立即注册
查看: 2455|回复: 7

这种的 字符串要如何提取,如何写 XPATH

[复制链接]
发表于 2020-2-28 00:05:22 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 要学习 于 2020-2-28 13:17 编辑
<br>

                <p  style="font-size:18px;" >69、单项选择题  商业银行发放短期信用贷款时,借记科目应是()
                    <p><p>
        A.活期存款<br />
        B.现金<br />
        C.抵押贷款<br />
        D.短期贷款</p>
</p></p> <br>

<br>

                <p  style="font-size:18px;" >70、多项选择题  在银行会计核算中,下列属于无形资产的有()。
                    <p><p>
        A.土地使用权<br />
        B.长期待摊费用<br />
        C.专利权<br />
        D.商誉<br />
        E.历史成本</p>
</p></p> <br>



我要如何写 XPATH才能把所有的 字符串 提取出来呢?

我这样写只能提取一部分

html.xpath('/p[@style="font-size:18px;"]/text()')

附件为 网页源码 新建文本文档.rar (32.53 KB, 下载次数: 4)
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-2-28 05:10:14 | 显示全部楼层
  1. html.xpath('//p/text()')
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-28 13:16:54 | 显示全部楼层

这句会把所有<p>下的内容都获取了。
不是我想要的。

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-28 13:17:49 | 显示全部楼层
etree.HTML(data).xpath('//p[@style="font-size:18px;"]/text()')
这个能把前面部分 提取到。
后面 选择题 选择的内容 都是在 <p style="font-size:18px;" >这个往后的 第二个<p>里,要如何获取呢。我尝试了 都是失败的
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-28 13:43:46 | 显示全部楼层
用了 这个 ,。,也取不到字符串

.xpath("//p[@style='font-size:18px;']/../preceding-sibling::p/p/text()")
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-28 21:39:32 | 显示全部楼层
各位老师晚上好
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-29 00:01:56 | 显示全部楼层
对于这种不守规矩的网页代码 上正则吧 少年
这网页还不是一般的烂啊 有些没答案 有些少一个答案
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-29 03:19:15 | 显示全部楼层
要学习 发表于 2020-2-28 13:16
这句会把所有下的内容都获取了。
不是我想要的。

看不懂你想要啥,给我个例子
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-22 23:33

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表