神的不在场证明 发表于 2022-3-3 13:00:49

新手求助,python scrapy怎么提取到这些标签呢




我发现这些标签的样式,后面都是带 __ + 随机字符的,在使用scrapy爬取的前提下,大佬们我应该怎么去获取到这些标签呢

伏惜寒 发表于 2022-3-3 13:00:50

使用模糊查询,用下面这句,意思是匹配class属性中的字段包含‘comtemt-layout__item__’
//*

isdkz 发表于 2022-3-3 15:03:05

那你就不要用标签的class了呗,用标签的位置来查找不行吗?

神的不在场证明 发表于 2022-3-3 16:39:31

isdkz 发表于 2022-3-3 15:03
那你就不要用标签的class了呗,用标签的位置来查找不行吗?

这种不确定性太多了,感觉治标不治本

神的不在场证明 发表于 2022-3-4 11:26:31

有没大佬求救。。。。

wiselin 发表于 2022-3-4 15:28:55

我提供个思路,就是从class的值最右边开始用正则匹配,然后一直往左匹配到下划线为止,目前看来共性是这个

神的不在场证明 发表于 2022-3-4 19:57:23

wiselin 发表于 2022-3-4 15:28
我提供个思路,就是从class的值最右边开始用正则匹配,然后一直往左匹配到下划线为止,目前看来共性是这个

为啥是从最右边开始匹配,最右边的是随机字符,不应该从左往右吗

wiselin 发表于 2022-3-7 09:47:19

神的不在场证明 发表于 2022-3-4 19:57
为啥是从最右边开始匹配,最右边的是随机字符,不应该从左往右吗

匹配不是一定要从左到右的,最重要是有适合需求的模式,从左到右,class后面的下划线都是不固定的,没法提去,从右到左都是遇到第一条就可以停止匹配了
页: [1]
查看完整版本: 新手求助,python scrapy怎么提取到这些标签呢