[已解决]xpath解析如何去掉文本中的空格和换行？

jjxx2005 · 发表于 2020-7-13 08:46:18

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import requests
from lxml import etree
UA伪装 = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.92 Safari/537.36'}
url2 = 'http://www.jkl.com.cn/cn/shopLis.aspx?id=862'
响应数据1 = requests.get(url=url2, headers=UA伪装).text
tree1 = etree.HTML(响应数据1)
店铺名称 = tree1.xpath('//span[@class="con01"]/text()')
for 店名 in 店铺名称:
print(店名)

复制代码

我提取出来的是一个列表，每个名字有空格和换行，如果我提取一段文本我知道normalize-space可以去掉空格，但是现在是一个列表，如果我用了这个函数，就只显示第一个元素了，请问各位大大有没有解决方法，先谢过了

最佳答案

月排行榜 / 总排行榜

Twilight6

2020-7-13 08:50:44

import requests

from lxml import etree

UA伪装 = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.92 Safari/537.36'}

url2 = 'http://www.jkl.com.cn/cn/shopLis.aspx?id=862'

响应数据1 = requests.get(url=url2, headers=UA伪装).text

tree1 = etree.HTML(响应数据1)

店铺名称 = tree1.xpath('//span[@class="con01"]/text()')

for 店名 in 店铺名称:

print(店名[2:].strip())
复制代码

跳转到最佳答案楼层

Twilight6 · 发表于 2020-7-13 08:50:44

这个最佳答案由 Twilight6 给出，感谢 Twilight6 的回答。

单击隐藏图章

import requests

from lxml import etree

UA伪装 = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.92 Safari/537.36'}

url2 = 'http://www.jkl.com.cn/cn/shopLis.aspx?id=862'

响应数据1 = requests.get(url=url2, headers=UA伪装).text

tree1 = etree.HTML(响应数据1)

店铺名称 = tree1.xpath('//span[@class="con01"]/text()')

for 店名 in 店铺名称:

print(店名[2:].strip())
复制代码

账号		自动登录	找回密码
密码			立即注册