鱼C论坛

 找回密码
 立即注册
查看: 2587|回复: 2

[已解决]有大神知道怎么用python匹配不同excel的相似内容吗?

[复制链接]
发表于 2020-2-28 22:20:01 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
打个比方,公司比如有7、8个合同台帐记录着合同的不同信息,但都是同一个合同的信息如图
QQ截图20200228221140.jpg


但是由于前后经手的人太多,同一个数据,同一个名称怎么表述的都有,什么
AB公司、     
AB有限公司、

CD有限责任公司、
CD责任有限公司、

ACBD有限公司
ABD公司
近万的数据量,人工交叉比对的话显然是不现实的。研究了好久,只是在网上看到有类似经历的人用Python叫做fuzzywuzzy的库,用它来进行模糊匹配。然后还要用笛卡尔积进行分析,但具体也没说怎么做。

现在我想把这些表的所有信息统一进一个excel表里,同时也要为下一步导入sql server进行数据分析做准备。
不知道有没有大神指点一下

最佳答案
2020-2-29 01:03:50
找找有没有可用于中文模糊匹配的模块吧,没有的话只能自己去写简易匹配方法了,根据你的数据特点针对性的写,难度应该会低很多。
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-2-28 22:51:49 | 显示全部楼层
半个小时过去了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-29 01:03:50 From FishC Mobile | 显示全部楼层    本楼为最佳答案   
找找有没有可用于中文模糊匹配的模块吧,没有的话只能自己去写简易匹配方法了,根据你的数据特点针对性的写,难度应该会低很多。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-1 19:39

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表