有关于requests_html的爬虫问题,萌新交流区,萌新训练营,鱼C论坛

你再掐我试试 发表于 2020-5-9 22:45:43

有关于requests_html的爬虫问题

我写了一段代码
from requests_html import HTMLSession
session = HTMLSession()

links = ['http://stock.finance.sina.com.cn/usstock/quotes/aapl.html', \
'http://stock.finance.sina.com.cn/usstock/quotes/bidu.html', \
'http://stock.finance.sina.com.cn/usstock/quotes/msft.html']

for link in links:
r = session.get(link)
r.html.render()
price = r.html.find('#hqPrice', first=True)
print(price)

但是输出的结果是这样的：
<Element 'div' class=('hq_now', 'up') id='hqPrice' style='color: silver;'>
<Element 'div' class=('hq_now', 'up') id='hqPrice' style=''>
<Element 'div' class=('hq_now', 'up') id='hqPrice' style=''>

小白完全看不懂
求教是怎么一回事。

qiuyouzhi 发表于 2020-5-10 08:42:30

1，应该以问题求助方式发提问帖。
2，返回的应该是是一个Element对象，应该有一些方法可以
提取数据。

你再掐我试试 发表于 2020-5-10 10:09:41

qiuyouzhi 发表于 2020-5-10 08:42
1，应该以问题求助方式发提问帖。
2，返回的应该是是一个Element对象，应该有一些方法可以
提取数据。

不好意思，昨天搞得太晚了，迷迷糊糊发错板块了。

页: [1]

鱼C论坛's Archiver

有关于requests_html的爬虫问题