鱼C论坛

 找回密码
 立即注册
查看: 603|回复: 11

[已解决]Beautiful Soup 标签取值求助

[复制链接]
发表于 2019-1-7 09:48:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. <td width="73%" height="29" background="images/dot_bg.gif">                        <img src="images/aer1.gif" width="8" height="14">                      <a href='*****' title='文章标题:2018年下半年招聘聘任制(公开招考)工作人员笔试人员名单的公告
  2. 添加者:gdszptrsc
  3. 添加时间:2019-1-2 19:01:50
  4. 点击次数:1169'>2018年下半年招聘聘任制(公开招考)工作人员笔试人员名单的公告</a>                    </td>
复制代码


上面为网页的源码,我想用BS取最后的一句的标题,要是用 ".a.get('title')"取出来的就还会带有title标签里面的添加者和添加时间、点击此处、有没有什么方法取到源码中那个点击次数>后面的标题。
最佳答案
2019-1-7 14:47:03
罗同学 发表于 2019-1-7 14:02
不是啊、去文本还是会的,就是下面这个图,只会用get('title')来去,但是这个里面的文本带了一些不想要的 ...

我写对了,现在电脑没在身边。无法写代码
你是想要链接的文本内容。
就是a标签中的text属性啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-1-7 10:02:04 | 显示全部楼层
就获取文本内容对吧??
直接
  1. a.text
复制代码
就行了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-7 10:08:01 | 显示全部楼层
字符串分割取-1
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-1-7 14:02:12 | 显示全部楼层
wongyusing 发表于 2019-1-7 10:02
就获取文本内容对吧??
直接就行了

不是啊、去文本还是会的,就是下面这个图,只会用get('title')来去,但是这个里面的文本带了一些不想要的文本、图里面下面那个画了红框的的内容是真正需要的,但是他没有标签,不知道怎么取它的值
1.jpg
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-1-7 14:03:15 | 显示全部楼层

-1就取到了浏览次数的最后一个数字
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-7 14:16:39 | 显示全部楼层
罗同学 发表于 2019-1-7 14:03
-1就取到了浏览次数的最后一个数字

有换行么,按换行分割
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-7 14:47:03 From FishC Mobile | 显示全部楼层    本楼为最佳答案   
罗同学 发表于 2019-1-7 14:02
不是啊、去文本还是会的,就是下面这个图,只会用get('title')来去,但是这个里面的文本带了一些不想要的 ...

我写对了,现在电脑没在身边。无法写代码
你是想要链接的文本内容。
就是a标签中的text属性啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-1-7 14:51:02 | 显示全部楼层
wongyusing 发表于 2019-1-7 14:47
我写对了,现在电脑没在身边。无法写代码
你是想要链接的文本内容。
就是a标签中的text属性啊


大神、可以了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-7 14:56:39 From FishC Mobile | 显示全部楼层
罗同学 发表于 2019-1-7 14:51
大神、可以了

下次遇到这种问题,先把html代码复制到编辑器里面,观察一下就不会错乱了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-1-7 15:08:50 | 显示全部楼层
wongyusing 发表于 2019-1-7 14:56
下次遇到这种问题,先把html代码复制到编辑器里面,观察一下就不会错乱了

受教了~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-8 02:31:05 | 显示全部楼层
我觉的很多还是用正则好,BS4我感觉用起来不顺手
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-1-8 08:49:46 | 显示全部楼层
四点好 发表于 2019-1-8 02:31
我觉的很多还是用正则好,BS4我感觉用起来不顺手

因为我是要获取的文本内容、没有具体的规则、正则表达不好写啊、太烧脑了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-17 10:28

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表