|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 futui 于 2023-3-29 17:00 编辑
需求:我想用下面这个代码 ,找到X方方这个人
###代码的第四行代码”print(response) “ 在显示屏上看不到方方这个名字,如果用下面两行代码写入桌面文件则可以看到 方方这个名字
with open(r'C:\Users\ppp\Desktop\webpage.txt', "w") as f:
f.write(r)
我想用xpath 达到目的,要如何做,求大师帮帮忙
###代码
from lxml import etree
import requests
response = download_fund_jbgk('000001')
print(response)
html = etree.HTML(response)
result = etree.tostring(html)
#print(result.decode())
ff=result.xpath('//*[@id="bodydiv"]/div[8]/div[3]/div[2]/div[3]/div/div[1]/table/tbody/tr[6]/td[1]/a[1]')
print(ff)
def download_fund_jbgk(fund_code):
《地址= '##fundf10.eastmoney.com/jbgk_' + fund_code + '.html'》
r = requests.get(url)
response = r.text
return response
##:http://
代码中的 xpath 我给你改了一下:
因为浏览器通常会给表格自动加上 tbody 标签,但是代码里面一般没写,所以我把 tbody 去掉了
获取文本加上了 text() 所以我把 a[1] 换成了 a/text()
a[1] 只能取到第一个名字所在的元素,取文本用 text(),而我换成 a 会把两个名字都取出来
//*[@id="bodydiv"]/div[8]/div[3]/div[2]/div[3]/div/div[1]/table/tbody/tr[6]/td[1]/a[1]
//*[@id="bodydiv"]/div[8]/div[3]/div[2]/div[3]/div/div[1]/table/tr[6]/td[1]/a/text()
- ###代码
- from lxml import etree
- import requests
- def download_fund_jbgk(fund_code):
- url = 'http://fundf10.eastmoney.com/jbgk_' + fund_code + '.html'
- r = requests.get(url)
- response = r.text
- print(url)
- return response
-
- response = download_fund_jbgk('000001')
- html = etree.HTML(response)
- result = etree.tostring(html)
- #print(result.decode())
- ff = html.xpath('//*[@id="bodydiv"]/div[8]/div[3]/div[2]/div[3]/div/div[1]/table/tr[6]/td[1]/a/text()')
- print(ff)
复制代码
|
|