[已解决]求助如何获取本地html文件里面的全部文本

xue11 · 发表于 2019-6-19 22:17:03

本帖最后由 xue11 于 2019-6-19 22:20 编辑

不支持上传html文件，故截下图。
个人想获取本地html文件里面的全部文本，试着用beautifulsoup解析再提取发现不行。例如截图中360首页文件，其他本地html文件均可；请教各位如何获取全部文本，非常感谢

最佳答案

ietar

2019-6-19 22:17:04

我也来蹭悬赏了

ietar · 发表于 2019-6-19 22:17:04

我也来蹭悬赏了

ba21 · 发表于 2019-6-19 22:25:09

html 本就是文本文件。
直接操用txt来操作就是了

xue11 · 发表于 2019-6-19 22:49:48

ba21 发表于 2019-6-19 22:25
html 本就是文本文件。
直接操用txt来操作就是了

初学者，能否举个例子，谢谢

ba21 · 发表于 2019-6-20 00:22:07

xue11 发表于 2019-6-19 22:49
初学者，能否举个例子，谢谢

既然是初学者就先学着，就算我给你举例读写文本文件，其它的你也不见得会。
with open(r"pass.txt","r") as f: # .txt 改 .html
for each_line in f:
print(each_line)

2692733373 · 发表于 2019-6-21 17:05:07

先读取文本然后匹配出来自己要的东西

快速收敛 · 发表于 2019-6-21 18:14:47

1.先用文件open读成html字符串
2.再用Beautifulsoup将读取的html字符串转化成可解析的Beautifulsoup对象
3.进行解析，获取需要的数据

账号		自动登录	找回密码
密码			立即注册