|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
toc_url_list = []
toc_block = re.findall('正文(.*?)</tbody>', data, re.S)[0]
toc_url = re.findall('href="(.*?)"', toc_block, re.S)
for url in toc_url:
toc_url_list.append(start_url + url)
print(toc_block)
运行代码后,标红这行代码,去掉最后[0]横着显示。不去[0],竖着显示。大神帮解释下,谢谢了
这行代码中使用了Python内置的re(正则表达式)模块的findall函数,在指定范围内,查找所有匹配某个特定正则表达式的字符串,并将它们以列表的形式返回。
具体来说,这行代码的作用是从字符串data中匹配出包含字符串“正文”和</tbody>之间的部分,然后通过re.findall函数提取其中所有以“href=”开头的字符串,即链接URL。所以得到的结果是一个包含多个URL链接的列表toc_url。
如果不去掉最后的[0],输出结果将以包含所有匹配结果的列表形式展示,每个匹配结果为列表中的一个元素。如果去掉最后的[0],输出结果将只展示第一个匹配结果,以单个字符串的形式展示。
求最佳答案
|
|