[已解决]爬虫，，如何获取html中含有html中的链接地址？

zyj1214 · 发表于 2023-12-13 20:13:25

您需要登录才可以下载或查看，没有账号？立即注册

x

图片 1 位置有个 html

怎么用xpath获取 2 位置的video标签中的src的链接地址

最佳答案

Twilight6

2023-12-14 08:55:40

最简单的方法，就是直接选择你想要获取的标签，右击后选择 Copy -> Copy Xpath 即可

之后得到 Xpath 后，再适当修改 xpath 语法，因为这样获取是比较死板的，一条线的直达所选标签

FishC · 发表于 2023-12-13 20:13:47

要获取HTML中的链接地址，可以使用Python中的爬虫库，例如Requests和BeautifulSoup。以下是一个示例代码，演示如何获取HTML中链接地址：

复制代码

对于第二个问题，如果要使用XPath获取HTML中video标签中的src链接地址，可以使用Python的lxml库。以下是一个示例代码，演示如何使用XPath获取video标签中的src链接地址：

复制代码

这段代码中，我们首先将HTML字符串传递给etree.HTML()函数进行解析。然后，使用XPath表达式"//video/@src"来选取video标签中的src属性，通过索引[0]获取第一个匹配结果，并打印出来。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

Twilight6 · 发表于 2023-12-14 08:55:40

最简单的方法，就是直接选择你想要获取的标签，右击后选择 Copy -> Copy Xpath 即可

之后得到 Xpath 后，再适当修改 xpath 语法，因为这样获取是比较死板的，一条线的直达所选标签

账号		自动登录	找回密码
密码			立即注册