凌霄刀 发表于 2022-5-1 23:47:51

想写一个python数据整理的小工具,但是没有思路,有没有大佬解答一下

数据都是TXT的格式的例如:
命令-----HDSKJASDHKJ:;#
中文字符 : 中文字符D_CSCKM_TGT5
报文 : +++    中文字符D_CSCKM_TGT5      2022-04-27 11:41:10
O&M    #806358216
%%/*1880554673;%%
RETCODE = 0执行成功

##将第一个命令和第二个中文字符插入到下面每行中,并且只保留这些行与列,
----------------------
本地小区标识    基站标识小区标识小区偏移量(分贝)小区偏置(分贝)禁止切换标识禁止删除标识            ANR 标识本地小区名称                        邻区小区名称                                           小区测量优先级小区覆盖扩展(分贝)邻区分类标识控制模式归属小区开关高速用户小区特定偏置(分贝)串联邻区标识NSA DC用户小区偏移量(分贝)邻区添加时间聚合属性                  

0                               845685    17      0dB               0dB             允许切换      允许自动邻区关系算法删除否          中文字符D_CSCKM_TGT5_(800M)_1                   低优先级      0                   正式          自动模式关            2dB                         否            0dB                         2001-1-1      上行干扰检测协作邻区标识:关
0                              845685    18      0dB               0dB             允许切换      允许自动邻区关系算法删除否          中文字符D_CSCKM_TGT5_(800M)_2                   低优先级      0                   正式          自动模式关            2dB                         否            0dB                         2001-1-1      上行干扰检测协作邻区标识:关
0                              983836    146       -4dB            -1dB            允许切换      允许自动邻区关系算法删除否          中文字符F_THCPM_DRT3C_(800M)_2低优先级      0                   正式          自动模式关            2dB                         否            0dB                         2001-1-1      上行干扰检测协作邻区标识:关
1                              845685    16      0dB               0dB             允许切换      允许自动邻区关系算法删除否          中文字符D_CSCKM_TGT5_(800M)_0                   低优先级      0                   正式          自动模式关            2dB                         否            0dB                         2001-1-1      上行干扰检测协作邻区标识:关
1                               845685    18      0dB               0dB             允许切换      允许自动邻区关系算法删除否      中文字符D_CSCKM_TGT5_(800M)_2                   低优先级      0                   正式          自动模式关            2dB                         否            0dB                         2001-1-1      上行干扰检测协作邻区标识:关
(结果个数 = 5)


仍有后续报告输出

---    END

+++    中文字符D_CSCKM_TGT5      2022-04-27 11:41:10
O&M    #806358216
%%/*1880554673 MML Session=1651030862*%%
RETCODE = 0执行成功

ba21 发表于 2022-5-2 11:08:01

没描述清楚。
效果前,效果后截图上传

凌霄刀 发表于 2022-5-2 11:20:43

ba21 发表于 2022-5-2 11:08
没描述清楚。
效果前,效果后截图上传

就是上面的TXT格式,通过python,整理成excel格式的,
命令+中文字符+本地小区标识+基站标识
   xxx+   xxx+      xxxx+         xxx
txt开头:这一块只要两个信息命令与中文字符,其他都不要
中文字符 : 中文字符D_CSCKM_TGT5
报文 : +++    中文字符D_CSCKM_TGT5      2022-04-27 11:41:10
O&M    #806358216
%%/*1880554673;%%
RETCODE = 0执行成功

wp231957 发表于 2022-5-2 11:37:12

凌霄刀 发表于 2022-5-2 11:20
就是上面的TXT格式,通过python,整理成excel格式的,
命令+中文字符+本地小区标识+基站标识
   xxx+   ...

自己努力吧,反正我是看不懂你在问啥

阿奇_o 发表于 2022-5-2 15:06:13

如果我没理解错的话,
思路:单独把表格部分取出来,转为pandas.DataFrame 对象(df),然后取出"命令"和"中文字符",作为新的两列,添加到df 。
然后,加上要补全的其他信息,最后一起写到新的TXT里。

凌霄刀 发表于 2022-5-2 15:21:30

阿奇_o 发表于 2022-5-2 15:06
如果我没理解错的话,
思路:单独把表格部分取出来,转为pandas.DataFrame 对象(df),然后取出"命令" ...

对对,差不多就是,这个意思

zh134197 发表于 2022-5-2 21:24:37

本帖最后由 zh134197 于 2022-5-2 21:28 编辑

把两组数据放到列表里,然后用循环隔行插入不同的列表即可

凌霄刀 发表于 2022-5-2 22:27:52

zh134197 发表于 2022-5-2 21:24
把两组数据放到列表里,然后用循环隔行插入不同的列表即可

开头有格式的,前面几行只要两个,其他都不要。

niudd 发表于 2022-5-3 17:07:48

加油。

棉H 发表于 2022-5-3 17:22:54

加油
页: [1]
查看完整版本: 想写一个python数据整理的小工具,但是没有思路,有没有大佬解答一下