根据条另2列条件,求第三列值的问题,求大师帮忙,谢谢
data = [["2022-12-21",None,"会求数据","-0.40"],["2022-12-20","2.1016","会求数据","-0.77"],["2022-12-19","3698得息56.8","会求数据","-0.77"],["2022-12-18","1.9733","会求数据",""],["2022-12-17","698分得56","会求数据",""],
["2022-12-16","","",""],["2022-12-12","","会求数据","-0.40"]]
columns = ["日期","B","C","D"]
df = pd.DataFrame(data, columns=columns)
由于考虑不周,没设想None的情况,特再发请求
想求上面数据帧中c列的数据:
C列数据由B列和/或D列相应行决定:
如果B列某行是空或None,D列有数字,则C列对应行数据就是D列对应行数字除以0.28,
如果B列行是纯数字,则C列对应行数据就是B列数字加55,
如果B列行是含数字的字符串,则C列对应行数据就是B列字符串中提出的第组数字除以D列不为零的数字
其它情况,C列不作任何计算
求大师帮忙指导,谢谢! 本帖最后由 歌者文明清理员 于 2023-4-17 20:41 编辑
根据您提供的条件,可以使用如下代码计算C列的值:
import pandas as pd
import re
# 定义一个函数用于从字符串中提取数字
def extract_number(string):
pattern = r'\d+\.*\d*'
match = re.search(pattern, string)
if match:
return float(match.group())
else:
return None
# 定义一个函数用于计算C列的值
def calculate_c_value(row):
b_value = row['B']
d_value = row['D']
if pd.isna(b_value):
if pd.notna(d_value):
return float(d_value) / 0.28
else:
return None
elif isinstance(b_value, (int, float)):
return float(b_value) + 55
elif isinstance(b_value, str):
b_number = extract_number(b_value)
if b_number is not None and pd.notna(d_value) and d_value != '0':
return b_number / float(d_value)
else:
return None
else:
return None
# 创建DataFrame并应用计算函数
data = [["2022-12-21",None,"会求数据","-0.40"],
["2022-12-20","2.1016","会求数据","-0.77"],
["2022-12-19","3698得息56.8","会求数据","-0.77"],
["2022-12-18","1.9733","会求数据",""],
["2022-12-17","698分得56","会求数据",""],
["2022-12-16","","",""],
["2022-12-12","","会求数据","-0.40"]]
columns = ["日期","B","C","D"]
df = pd.DataFrame(data, columns=columns)
df['C'] = df.apply(calculate_c_value, axis=1)
这个代码将根据您提供的条件对数据帧进行计算和更新,为C列填充相应行的值。 本帖最后由 sfqxx 于 2023-4-17 20:41 编辑
可以使用Pandas库来遍历DataFrame中每一行的数据,判断B列和D列的情况,并按照题目要求进行相应的计算。
以下是代码示例:
首先下载panda
pip install pandas
import pandas as pd
import re
data = [["2022-12-21", None, "会求数据", "-0.40"],
["2022-12-20", "2.1016", "会求数据", "-0.77"],
["2022-12-19", "3698得息56.8", "会求数据", "-0.77"],
["2022-12-18", "1.9733", "会求数据", ""],
["2022-12-17", "698分得56", "会求数据", ""],
["2022-12-16", "", "", ""],
["2022-12-12", "", "会求数据", "-0.40"]]
columns = ["日期", "B", "C", "D"]
df = pd.DataFrame(data, columns=columns)
def calculate_C(row):
b_value = row["B"]
d_value = row["D"]
if pd.isnull(b_value) or b_value == "None":
if d_value != "":
return float(d_value) / 0.28
else:
return ""
if isinstance(b_value, (int, float)):
return b_value + 55
if isinstance(b_value, str):
nums = re.findall(r"\d+\.*\d*", b_value)
if len(nums) > 0 and d_value != "":
return float(nums) / float(d_value)
else:
return ""
return ""
df["C"] = df.apply(calculate_C, axis=1)
print(df["C"])
代码逐行解释:
首先导入必要的库和定义初始的DataFrame数据。
然后定义一个函数`calculate_C(row)`,该函数形参是一行数据(Series类型),用来计算该行对应的C列的值。对于这个问题中的每种情况,使用`if`语句来检查并分别计算C列的值,并最终返回计算出的
有用请设置最佳答案 你好!根据你的需求,可以使用以下代码计算C列的值:
import pandas as pd
import re
data = [["2022-12-21", None, "会求数据", "-0.40"], ["2022-12-20", "2.1016", "会求数据", "-0.77"], ["2022-12-19", "3698得息56.8", "会求数据", "-0.77"],
["2022-12-18", "1.9733", "会求数据", ""], ["2022-12-17", "698分得56", "会求数据", ""],
["2022-12-16", "", "", ""], ["2022-12-12", "", "会求数据", "-0.40"]]
columns = ["日期", "B", "C", "D"]
df = pd.DataFrame(data, columns=columns)
def calculate_c(row):
b = row['B']
d = row['D']
if (b == "" or b is None) and isinstance(d, str) and d.replace(".", "").isdigit():
return float(d) / 0.28
elif isinstance(b, str) and b.replace(".", "").isdigit():
return float(b) + 55
elif isinstance(b, str) and re.search(r'\d+', b) is not None:
first_number = re.search(r'\d+', b).group()
if isinstance(d, str) and d.replace(".", "").isdigit() and float(d) != 0:
return float(first_number) / float(d)
return row['C']
df['C'] = df.apply(calculate_c, axis=1)
print(df)
这段代码首先定义了一个calculate_c函数,用于根据你的条件计算C列的值。然后使用apply方法将此函数应用于数据帧的每一行,计算出C列的值。
运行该代码后,你可以看到更新后的数据帧。希望这对你有所帮助!如果还有其他问题,请随时提问。 歌者文明清理员 发表于 2023-4-17 20:38
根据您提供的条件,可以使用如下代码计算C列的值:
这个代码将根据您提供的条件对数据帧进行计算和更新 ...
https://t3.wodetu.cn/2023/04/08/7408df3fbffa9f5551168a8d38de45d5.png def calculate_C(row):
b_value = row["B"]
d_value = row["D"]
if pd.isnull(b_value) or b_value == "":
if d_value != "":
return float(d_value) / 0.28
else:
return ""
if isinstance(b_value, (int, float)):
return b_value + 55
if isinstance(b_value, str):
nums = re.findall(r"\d+\.*\d*", b_value)
if len(nums) > 0 and d_value != "":
return float(nums) / float(d_value)
else:
return ""
return ""
df["C"] = df.apply(calculate_C, axis=1)
print(df)
歌者文明清理员 发表于 2023-4-17 20:58
你的代码运行甚至报错{:10_249:}
页:
[1]