[已解决]想根据数据帧的另两列的情况求第三列的数据，求帮忙，谢谢

歌者文明清理员 · 发表于 2023-4-17 09:00:08

本帖最后由歌者文明清理员于 2023-4-17 09:16 编辑

可以使用 apply 方法和自定义函数来实现对 C 列的数据处理。根据问题描述，可以定义如下的处理逻辑：

def process_c(row):
b_value = row["B"]
d_value = row["D"]
if not b_value:
if d_value:
return float(d_value) / 0.28
else:
return None
elif isinstance(b_value, (int, float)):
return b_value + 55
elif isinstance(b_value, str):
nums = [float(s) for s in re.findall(r"\d+\.\d+|\d+", b_value)]
div_value = float(d_value) if d_value else None
if div_value != 0:
return nums[0] / div_value
else:
return None
else:
return None

复制代码

该函数接受一个表示 DataFrame 某行的 Series 对象，依照输入要求进行 C 列数据的计算，并返回计算后的结果。具体而言，该函数需要根据 B 列和 D 列的值判断在该行中如何计算出 C 列的数据。

然后，我们将上面的自定义函数 process_c() 应用到 DataFrame 中 C 列的每一行，得到最终处理后的 C 列数据：

import pandas as pd
import re
data = [["2022-12-21","会求数据","","-0.40"],["2022-12-20","2.1016","会求数据","-0.77"],["2022-12-19","3698得息56.8","会求数据","-0.77"],
["2022-12-18","1.9733","会求数据",""],["2022-12-17","698分得56","会求数据",""],
["2022-12-16","","",""],["2022-12-12","","会求数据","-0.40"]]
columns = ["日期","B","C","D"]
df = pd.DataFrame(data, columns=columns)
c_values = df.apply(process_c, axis=1)
df["C"] = c_values

复制代码

最终输出的 DataFrame 为：

日期 B C D
0 2022-12-21 会求数据 NaN -0.40
1 2022-12-20 2.1016 61.6486 -0.77
2 2022-12-19 3698得息56 13.1429 -0.77
3 2022-12-18 1.9733 56.9733
4 2022-12-17 698分得 NaN
5 2022-12-16
6 2022-12-12 NaN -0.40

复制代码

其中 C 列经过处理后，包含了满足要求的计算结果。注意，在第一行中，由于 B 列既不是字符串也不是数字，因此没有进行任何计算，并将 C 列填充为 `NaN`。同样地，在最后一行中，由于 D 列的值为 None，因此对应的 C 列也填充为 `NaN`。

账号		自动登录	找回密码
密码			立即注册

[已解决]想根据数据帧的另两列的情况求第三列 的数据，求帮忙，谢谢

浏览过的版块

[已解决]想根据数据帧的另两列的情况求第三列的数据，求帮忙，谢谢