|
发表于 2023-7-20 13:07:24
|
显示全部楼层
首先,非常感谢你分享了这段代码。我发现问题可能出现在 parse_content 函数中,你是在试图提取 class 为 'lazyloaded' 的元素的文本。然而,这个元素可能是图片或者其他无文本的元素,所以你得到的结果是空的。你可能需要重新检查这个选择器和你想提取的数据的实际HTML结构。
代码中的这一部分:
- # 使用CSS选择器选择所有class为'lazyloaded'的元素
- lazyloadeds = soup.select('.lazyloaded')
复制代码
在这里,你尝试提取 class 名为 'lazyloaded' 的所有元素。但是, lazyloaded 这个类名,通常是用于懒加载的图片,而不是包含文本的元素。因此,你可能需要重新检查你正在尝试提取的元素的 HTML 结构,以确认你使用的 CSS 选择器是否正确。
然后,你可能还需要检查这个网站是否有反爬虫的机制。如果有,你的请求可能被拒绝了,但由于你没有检查 HTTP 响应的状态码,你可能没有注意到这一点。
最后,为了帮助你解决问题,我需要你提供更多的信息。例如,你可以打印出你得到的 content 或 games 看看是否有你期待的内容。你还可以提供一下你希望从网页中提取的具体信息的样子,这样我们才能给出更准确的帮助。
希望这个解答能对你有所帮助!如果你有更多的问题,随时向我们提问。 |
|