新手求助,python scrapy怎么提取到这些标签呢
我发现这些标签的样式,后面都是带 __ + 随机字符的,在使用scrapy爬取的前提下,大佬们我应该怎么去获取到这些标签呢 使用模糊查询,用下面这句,意思是匹配class属性中的字段包含‘comtemt-layout__item__’
//* 那你就不要用标签的class了呗,用标签的位置来查找不行吗? isdkz 发表于 2022-3-3 15:03
那你就不要用标签的class了呗,用标签的位置来查找不行吗?
这种不确定性太多了,感觉治标不治本 有没大佬求救。。。。 我提供个思路,就是从class的值最右边开始用正则匹配,然后一直往左匹配到下划线为止,目前看来共性是这个 wiselin 发表于 2022-3-4 15:28
我提供个思路,就是从class的值最右边开始用正则匹配,然后一直往左匹配到下划线为止,目前看来共性是这个
为啥是从最右边开始匹配,最右边的是随机字符,不应该从左往右吗 神的不在场证明 发表于 2022-3-4 19:57
为啥是从最右边开始匹配,最右边的是随机字符,不应该从左往右吗
匹配不是一定要从左到右的,最重要是有适合需求的模式,从左到右,class后面的下划线都是不固定的,没法提去,从右到左都是遇到第一条就可以停止匹配了
页:
[1]