本帖最后由 foxiangzun 于 2019-11-5 15:43 编辑
你没把内容赋值出来,以下是我这边的测试结果,亲测,有效
- import requests
- from lxml import etree
- url = r'https://www.pearvideo.com/'
- headers = {
- 'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64)'
- }
- response = requests.get(url, headers=headers)
- webcontent = etree.HTML(response.text)
- cententce = webcontent.xpath("/html/body/div[2]/div[2]/div/ul[2]/li[1]/div/a/div[2]/div[2]/text()")
- print(cententce)
复制代码
另外,xpath 里面的内容尽量不要用单引号,用双引号更好,如果碰上需要引用指定的标签,且标签带了值,可以直接用单引号把值包裹起来,cententce 那一段也可以写成下面的样子:
- cententce = webcontent.xpath("//div[@class='act-main cmmain']/div[2]/div/ul[2]/li[1]/div/a/div[2]/div[2]/text()")
复制代码