鱼C论坛

 找回密码
 立即注册
查看: 5144|回复: 11

pandas处理

[复制链接]
发表于 2023-5-11 18:38:47 | 显示全部楼层
isdkz 发表于 2023-5-11 18:37
代码中添加年、月、日列的部分出错可能是因为读入的日期格式不符合预期。在这种情况下,可以使用pandas中的 ...

19秒差距?你是小号还是爬虫,
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-5-11 18:44:24 | 显示全部楼层
出错的原因是缩进不一致。应该将第一行和第二行的缩进对齐,即:

   
  1. df["year"] = df["date"].apply(lambda x: int(str(x)[:4]))
  2.     df["month"] = df["date"].apply(lambda x: int(str(x)[4:6]) if not str(x)[4:6].isspace() else 0)
  3.     df["day"] = df["date"].apply(lambda x: int(str(x)[6:]))
复制代码


另外,如果日期格式有非数字字符,比如空格或其他符号,会导致字符串切片出现错误。可以在字符串切片之前使用 `.strip()`去除空格等字符,可以改为:

   
  1. df["year"] = df["date"].apply(lambda x: int(str(x).strip()[:4]))
  2.     df["month"] = df["date"].apply(lambda x: int(str(x).strip()[4:6]) if not str(x).strip()[4:6].isspace() else 0)
  3.     df["day"] = df["date"].apply(lambda x: int(str(x).strip()[6:]))
复制代码


这样处理后,在出现非数字字符时就不会报错了。
有用请设置最佳答案
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-4-1 21:54

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表