鱼C论坛

 找回密码
 立即注册
查看: 1185|回复: 3

[已解决]怎样用python将多列数据转换为两列数据?数据量大

[复制链接]
发表于 2021-8-15 15:13:58 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 龖釋 于 2021-8-15 15:17 编辑

徐州东观音机场睢宁宿迁泗阳淮安东扬州东大港南镇江南京
南京镇江扬州东高邮淮安东涟水连云港赣榆
赣榆连云港灌云淮安东高邮北扬州东大港南镇江南京
南京镇江扬州东宝应淮安东泗阳宿迁睢宁观音机场徐州东
徐州东睢宁宿迁泗阳淮安东宝应扬州东镇江南京
南京镇江扬州东泗阳宿迁睢宁观音机场徐州东
徐州东宿迁淮安东宝应高邮北高邮扬州东镇江南京
南京扬州东宝应淮安东宿迁睢宁徐州东
南京镇江灌南灌云连云港
连云港灌云灌南涟水淮安东扬州东镇江南京
有大量Excel数据,数据格式如上,怎么用python将每一行数据分割成下面的格式
徐州东    观音机场
徐州东    睢宁
徐州东    宿迁
。。。。。。
徐州东    赣榆
观音机场    睢宁
观音机场    宿迁
。。。。。。
观音机场    赣榆
睢宁   宿迁
。。。。。。
。。。。。。
镇江    南京


求助怎么用python生成这样的数据,代码怎么写?
最佳答案
2021-8-15 18:01:00
本帖最后由 阿奇_o 于 2021-8-15 18:21 编辑
import pandas as pd 
import numpy as np

df = pd.read_excel("多列数据转为两列.xlsx")  # 起点-终点 遍历组合
t = []
for i, row in df.iterrows():
    # print(type(row))
    for j in range(len(row)):
        for k in range(1, len(row)):
            st = (row.iloc[j], row.iloc[k])
            t.append(st)
dft = pd.DataFrame(data=t) 
dft.columns = ['起点', '目的地']
# print(dft)
print(dft[:30])

ps: 用 df.itertuples()来遍历,会更快写。处理逻辑类似上面。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-15 16:33:21 | 显示全部楼层
这有啥规律?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-8-15 17:48:52 | 显示全部楼层

就是在每一行的数据中,每一个站点除与自身外,与其他站点之间两两都有连接
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-15 18:01:00 | 显示全部楼层    本楼为最佳答案   
本帖最后由 阿奇_o 于 2021-8-15 18:21 编辑
import pandas as pd 
import numpy as np

df = pd.read_excel("多列数据转为两列.xlsx")  # 起点-终点 遍历组合
t = []
for i, row in df.iterrows():
    # print(type(row))
    for j in range(len(row)):
        for k in range(1, len(row)):
            st = (row.iloc[j], row.iloc[k])
            t.append(st)
dft = pd.DataFrame(data=t) 
dft.columns = ['起点', '目的地']
# print(dft)
print(dft[:30])

ps: 用 df.itertuples()来遍历,会更快写。处理逻辑类似上面。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-13 20:00

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表