futui 发表于 2023-4-17 20:35:59

根据条另2列条件,求第三列值的问题,求大师帮忙,谢谢

data = [["2022-12-21",None,"会求数据","-0.40"],["2022-12-20","2.1016","会求数据","-0.77"],["2022-12-19","3698得息56.8","会求数据","-0.77"],
["2022-12-18","1.9733","会求数据",""],["2022-12-17","698分得56","会求数据",""],
["2022-12-16","","",""],["2022-12-12","","会求数据","-0.40"]]
columns = ["日期","B","C","D"]
df = pd.DataFrame(data, columns=columns)

由于考虑不周,没设想None的情况,特再发请求

想求上面数据帧中c列的数据:
C列数据由B列和/或D列相应行决定:
如果B列某行是空或None,D列有数字,则C列对应行数据就是D列对应行数字除以0.28,
如果B列行是纯数字,则C列对应行数据就是B列数字加55,
如果B列行是含数字的字符串,则C列对应行数据就是B列字符串中提出的第组数字除以D列不为零的数字
其它情况,C列不作任何计算
求大师帮忙指导,谢谢!

歌者文明清理员 发表于 2023-4-17 20:38:55

本帖最后由 歌者文明清理员 于 2023-4-17 20:41 编辑

根据您提供的条件,可以使用如下代码计算C列的值:
import pandas as pd
import re

# 定义一个函数用于从字符串中提取数字
def extract_number(string):
    pattern = r'\d+\.*\d*'
    match = re.search(pattern, string)
    if match:
      return float(match.group())
    else:
      return None

# 定义一个函数用于计算C列的值
def calculate_c_value(row):
    b_value = row['B']
    d_value = row['D']
    if pd.isna(b_value):
      if pd.notna(d_value):
            return float(d_value) / 0.28
      else:
            return None
    elif isinstance(b_value, (int, float)):
      return float(b_value) + 55
    elif isinstance(b_value, str):
      b_number = extract_number(b_value)
      if b_number is not None and pd.notna(d_value) and d_value != '0':
            return b_number / float(d_value)
      else:
            return None
    else:
      return None

# 创建DataFrame并应用计算函数
data = [["2022-12-21",None,"会求数据","-0.40"],
      ["2022-12-20","2.1016","会求数据","-0.77"],
      ["2022-12-19","3698得息56.8","会求数据","-0.77"],
      ["2022-12-18","1.9733","会求数据",""],
      ["2022-12-17","698分得56","会求数据",""],
      ["2022-12-16","","",""],
      ["2022-12-12","","会求数据","-0.40"]]
columns = ["日期","B","C","D"]
df = pd.DataFrame(data, columns=columns)

df['C'] = df.apply(calculate_c_value, axis=1)
这个代码将根据您提供的条件对数据帧进行计算和更新,为C列填充相应行的值。

sfqxx 发表于 2023-4-17 20:40:23

本帖最后由 sfqxx 于 2023-4-17 20:41 编辑

可以使用Pandas库来遍历DataFrame中每一行的数据,判断B列和D列的情况,并按照题目要求进行相应的计算。

以下是代码示例:

首先下载panda
pip install pandas

import pandas as pd
import re

data = [["2022-12-21", None, "会求数据", "-0.40"],
      ["2022-12-20", "2.1016", "会求数据", "-0.77"],
      ["2022-12-19", "3698得息56.8", "会求数据", "-0.77"],
      ["2022-12-18", "1.9733", "会求数据", ""],
      ["2022-12-17", "698分得56", "会求数据", ""],
      ["2022-12-16", "", "", ""],
      ["2022-12-12", "", "会求数据", "-0.40"]]
columns = ["日期", "B", "C", "D"]
df = pd.DataFrame(data, columns=columns)

def calculate_C(row):
    b_value = row["B"]
    d_value = row["D"]

    if pd.isnull(b_value) or b_value == "None":
      if d_value != "":
            return float(d_value) / 0.28
      else:
            return ""
         
    if isinstance(b_value, (int, float)):
      return b_value + 55
   
    if isinstance(b_value, str):
      nums = re.findall(r"\d+\.*\d*", b_value)
      if len(nums) > 0 and d_value != "":
            return float(nums) / float(d_value)
      else:
            return ""
   
    return ""

df["C"] = df.apply(calculate_C, axis=1)

print(df["C"])


代码逐行解释:

首先导入必要的库和定义初始的DataFrame数据。

然后定义一个函数`calculate_C(row)`,该函数形参是一行数据(Series类型),用来计算该行对应的C列的值。对于这个问题中的每种情况,使用`if`语句来检查并分别计算C列的值,并最终返回计算出的
有用请设置最佳答案

isdkz 发表于 2023-4-17 20:40:32

你好!根据你的需求,可以使用以下代码计算C列的值:

import pandas as pd
import re

data = [["2022-12-21", None, "会求数据", "-0.40"], ["2022-12-20", "2.1016", "会求数据", "-0.77"], ["2022-12-19", "3698得息56.8", "会求数据", "-0.77"],
      ["2022-12-18", "1.9733", "会求数据", ""], ["2022-12-17", "698分得56", "会求数据", ""],
      ["2022-12-16", "", "", ""], ["2022-12-12", "", "会求数据", "-0.40"]]
columns = ["日期", "B", "C", "D"]
df = pd.DataFrame(data, columns=columns)

def calculate_c(row):
    b = row['B']
    d = row['D']

    if (b == "" or b is None) and isinstance(d, str) and d.replace(".", "").isdigit():
      return float(d) / 0.28
    elif isinstance(b, str) and b.replace(".", "").isdigit():
      return float(b) + 55
    elif isinstance(b, str) and re.search(r'\d+', b) is not None:
      first_number = re.search(r'\d+', b).group()
      if isinstance(d, str) and d.replace(".", "").isdigit() and float(d) != 0:
            return float(first_number) / float(d)
    return row['C']

df['C'] = df.apply(calculate_c, axis=1)
print(df)


这段代码首先定义了一个calculate_c函数,用于根据你的条件计算C列的值。然后使用apply方法将此函数应用于数据帧的每一行,计算出C列的值。

运行该代码后,你可以看到更新后的数据帧。希望这对你有所帮助!如果还有其他问题,请随时提问。

歌者文明清理员 发表于 2023-4-17 20:58:49

歌者文明清理员 发表于 2023-4-17 20:38
根据您提供的条件,可以使用如下代码计算C列的值:

这个代码将根据您提供的条件对数据帧进行计算和更新 ...

https://t3.wodetu.cn/2023/04/08/7408df3fbffa9f5551168a8d38de45d5.png

futui 发表于 2023-4-17 21:29:02

def calculate_C(row):
    b_value = row["B"]
    d_value = row["D"]

    if pd.isnull(b_value) or b_value == "":
      if d_value != "":
            return float(d_value) / 0.28
      else:
            return ""
         
    if isinstance(b_value, (int, float)):
      return b_value + 55
   
    if isinstance(b_value, str):
      nums = re.findall(r"\d+\.*\d*", b_value)
      if len(nums) > 0 and d_value != "":
            return float(nums) / float(d_value)
      else:
            return ""
   
    return ""

df["C"] = df.apply(calculate_C, axis=1)

print(df)

isdkz 发表于 2023-4-17 21:40:34

歌者文明清理员 发表于 2023-4-17 20:58


你的代码运行甚至报错{:10_249:}
页: [1]
查看完整版本: 根据条另2列条件,求第三列值的问题,求大师帮忙,谢谢