关于pandas模块如何处理两个CSV文件
本帖最后由 1140813598 于 2021-10-18 22:44 编辑我现在有两个CSV文件test1.csv与test2.csv,现要求如下:
1.当文件test1的column1中没有文件test2的column1,则将文件test2的column1与column2添加到文件test1中
2.当文件test1的与文件test2的column1相同,则比对两个文件column2,若有差异,则用文件test2的column2替换掉文件test1的column2
我想知道该如何用pandas模块快速处理,请发一下源码,谢谢各位了。 那相当于把test2.csv复制一份到test1.csv??
直接用vlookup嘛,用两次就完成了 不知道是不是你描述的问题,我感觉,你要的是把test2 和 test1做一个去重合并 ,数值写入test1? 感觉好乱 本帖最后由 TeslaTong 于 2021-10-22 02:37 编辑
看起来像数据库的right join, 刚刚查了一下pandas好像也能做这个操作
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.join.html
可是为什么不直接用test2.csv呢
页:
[1]