1140813598 发表于 2021-10-18 22:38:16

关于pandas模块如何处理两个CSV文件

本帖最后由 1140813598 于 2021-10-18 22:44 编辑


我现在有两个CSV文件test1.csv与test2.csv,现要求如下:
1.当文件test1的column1中没有文件test2的column1,则将文件test2的column1与column2添加到文件test1中
2.当文件test1的与文件test2的column1相同,则比对两个文件column2,若有差异,则用文件test2的column2替换掉文件test1的column2
我想知道该如何用pandas模块快速处理,请发一下源码,谢谢各位了。

阿奇_o 发表于 2021-10-18 22:52:03

那相当于把test2.csv复制一份到test1.csv??

163by 发表于 2021-10-19 09:18:27

直接用vlookup嘛,用两次就完成了

z5560636 发表于 2021-10-20 11:09:14

不知道是不是你描述的问题,我感觉,你要的是把test2 和 test1做一个去重合并 ,数值写入test1?

sunyt 发表于 2021-10-20 11:15:45

感觉好乱

TeslaTong 发表于 2021-10-22 01:54:20

本帖最后由 TeslaTong 于 2021-10-22 02:37 编辑

看起来像数据库的right join, 刚刚查了一下pandas好像也能做这个操作
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.join.html

可是为什么不直接用test2.csv呢
页: [1]
查看完整版本: 关于pandas模块如何处理两个CSV文件