鱼C论坛

 找回密码
 立即注册
查看: 867|回复: 1

爬虫如何解析统一布局但html结构不同的html?

[复制链接]
发表于 2025-1-21 16:10:55 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
如剑桥词典: https://dictionary.cambridge.org/,有英汉,英日,英法多种语言的词典,所有词典页面的布局都类似,但实际html代码结构又有很多不同
对于这样的网站,除了每个页面编写一个解析函数,是否还有其他更简便的方法?
对于我要提取的信息,无非就是词语+音标+释义,有多个词性就分为多个元素存进列表中
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-9-23 07:35

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表