鱼C论坛

 找回密码
 立即注册
查看: 1632|回复: 7

[已解决]新手求助,python scrapy怎么提取到这些标签呢

[复制链接]
发表于 2022-3-3 13:00:49 | 显示全部楼层 |阅读模式
10鱼币
1.jpg


我发现这些标签的样式,后面都是带 __ + 随机字符的,在使用scrapy爬取的前提下,大佬们我应该怎么去获取到这些标签呢
最佳答案
2022-3-3 13:00:50
使用模糊查询,用下面这句,意思是匹配class属性中的字段包含‘comtemt-layout__item__’
//*[contains(@class, 'comtemt-layout__item__')]

最佳答案

查看完整内容

使用模糊查询,用下面这句,意思是匹配class属性中的字段包含‘comtemt-layout__item__’ //*[contains(@class, 'comtemt-layout__item__')]
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-3-3 13:00:50 | 显示全部楼层    本楼为最佳答案   
使用模糊查询,用下面这句,意思是匹配class属性中的字段包含‘comtemt-layout__item__’
//*[contains(@class, 'comtemt-layout__item__')]
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-3-3 15:03:05 | 显示全部楼层
那你就不要用标签的class了呗,用标签的位置来查找不行吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2022-3-3 16:39:31 | 显示全部楼层
isdkz 发表于 2022-3-3 15:03
那你就不要用标签的class了呗,用标签的位置来查找不行吗?

这种不确定性太多了,感觉治标不治本
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2022-3-4 11:26:31 | 显示全部楼层
有没大佬求救。。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-3-4 15:28:55 | 显示全部楼层
我提供个思路,就是从class的值最右边开始用正则匹配,然后一直往左匹配到下划线为止,目前看来共性是这个
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2022-3-4 19:57:23 | 显示全部楼层
wiselin 发表于 2022-3-4 15:28
我提供个思路,就是从class的值最右边开始用正则匹配,然后一直往左匹配到下划线为止,目前看来共性是这个

为啥是从最右边开始匹配,最右边的是随机字符,不应该从左往右吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-3-7 09:47:19 | 显示全部楼层
神的不在场证明 发表于 2022-3-4 19:57
为啥是从最右边开始匹配,最右边的是随机字符,不应该从左往右吗

匹配不是一定要从左到右的,最重要是有适合需求的模式,从左到右,class后面的下划线都是不固定的,没法提去,从右到左都是遇到第一条就可以停止匹配了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-22 05:29

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表