你再掐我试试 发表于 2020-5-9 22:45:43

有关于requests_html的爬虫问题

我写了一段代码
from requests_html import HTMLSession
session = HTMLSession()

links = ['http://stock.finance.sina.com.cn/usstock/quotes/aapl.html', \
         'http://stock.finance.sina.com.cn/usstock/quotes/bidu.html', \
         'http://stock.finance.sina.com.cn/usstock/quotes/msft.html']

for link in links:
    r = session.get(link)
    r.html.render()
    price = r.html.find('#hqPrice', first=True)
    print(price)

但是输出的结果是这样的:
<Element 'div' class=('hq_now', 'up') id='hqPrice' style='color: silver;'>
<Element 'div' class=('hq_now', 'up') id='hqPrice' style=''>
<Element 'div' class=('hq_now', 'up') id='hqPrice' style=''>

小白完全看不懂
求教是怎么一回事。

qiuyouzhi 发表于 2020-5-10 08:42:30

1,应该以问题求助方式发提问帖。
2,返回的应该是是一个Element对象,应该有一些方法可以
提取数据。

你再掐我试试 发表于 2020-5-10 10:09:41

qiuyouzhi 发表于 2020-5-10 08:42
1,应该以问题求助方式发提问帖。
2,返回的应该是是一个Element对象,应该有一些方法可以
提取数据。

不好意思,昨天搞得太晚了,迷迷糊糊发错板块了。
页: [1]
查看完整版本: 有关于requests_html的爬虫问题