鱼C论坛

 找回密码
 立即注册
查看: 1149|回复: 1

[已解决]得到网页数据后的提取

[复制链接]
发表于 2019-8-19 10:10:18 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
得到如下网页的数据,其实只想用其中的一个数据,就是:如图
1.png
然后怎么提取这一行数据,其实只是想要他的动态行情

最佳答案
2019-8-19 10:22:00
可以直接用BeautifulSoup的select方法,用css选择器来进行选择

  1. from bs4 import BeautifulSoup

  2. html = '<span class="nom last green">4146.0</span>'
  3. soup = BeautifulSoup(html,'lxml')
  4. results = soup.select('.nom.last.green')
  5. for result in results:
  6.     print(result.text)
复制代码


当然,数据提取的方式太多太多了,xpath,正则之类的都是可以的,你自己灵活选择。一般情况下,我优先选择使用xpath和css,实在不好提取的才会考虑正则。
1.png
1.jpg
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-8-19 10:22:00 | 显示全部楼层    本楼为最佳答案   
可以直接用BeautifulSoup的select方法,用css选择器来进行选择

  1. from bs4 import BeautifulSoup

  2. html = '<span class="nom last green">4146.0</span>'
  3. soup = BeautifulSoup(html,'lxml')
  4. results = soup.select('.nom.last.green')
  5. for result in results:
  6.     print(result.text)
复制代码


当然,数据提取的方式太多太多了,xpath,正则之类的都是可以的,你自己灵活选择。一般情况下,我优先选择使用xpath和css,实在不好提取的才会考虑正则。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-11-4 08:44

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表