鱼C论坛

 找回密码
 立即注册
查看: 2012|回复: 6

[已解决]根据条另2列条件,求第三列值的问题,求大师帮忙,谢谢

[复制链接]
发表于 2023-4-17 20:35:59 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
data = [["2022-12-21",None,"会求数据","-0.40"],["2022-12-20","2.1016","会求数据","-0.77"],["2022-12-19","3698得息56.8","会求数据","-0.77"],
["2022-12-18","1.9733","会求数据",""],["2022-12-17","698分得56","会求数据",""],
["2022-12-16","","",""],["2022-12-12","","会求数据","-0.40"]]
columns = ["日期","B","C","D"]
df = pd.DataFrame(data, columns=columns)

由于考虑不周,没设想None的情况,特再发请求

想求上面数据帧中c列的数据:
C列数据由B列和/或D列相应行决定:
如果B列某行是空或None,D列有数字,则C列对应行数据就是D列对应行数字除以0.28,
如果B列行是纯数字,则C列对应行数据就是B列数字加55,
如果B列行是含数字的字符串,则C列对应行数据就是B列字符串中提出的第组数字除以D列不为零的数字
其它情况,C列不作任何计算
求大师帮忙指导,谢谢!
最佳答案
2023-4-17 20:38:55
本帖最后由 歌者文明清理员 于 2023-4-17 20:41 编辑

根据您提供的条件,可以使用如下代码计算C列的值:
import pandas as pd
import re

# 定义一个函数用于从字符串中提取数字
def extract_number(string):
    pattern = r'\d+\.*\d*'
    match = re.search(pattern, string)
    if match:
        return float(match.group())
    else:
        return None

# 定义一个函数用于计算C列的值
def calculate_c_value(row):
    b_value = row['B']
    d_value = row['D']
    if pd.isna(b_value):
        if pd.notna(d_value):
            return float(d_value) / 0.28
        else:
            return None
    elif isinstance(b_value, (int, float)):
        return float(b_value) + 55
    elif isinstance(b_value, str):
        b_number = extract_number(b_value)
        if b_number is not None and pd.notna(d_value) and d_value != '0':
            return b_number / float(d_value)
        else:
            return None
    else:
        return None

# 创建DataFrame并应用计算函数
data = [["2022-12-21",None,"会求数据","-0.40"],
        ["2022-12-20","2.1016","会求数据","-0.77"],
        ["2022-12-19","3698得息56.8","会求数据","-0.77"],
        ["2022-12-18","1.9733","会求数据",""],
        ["2022-12-17","698分得56","会求数据",""],
        ["2022-12-16","","",""],
        ["2022-12-12","","会求数据","-0.40"]]
columns = ["日期","B","C","D"]
df = pd.DataFrame(data, columns=columns)

df['C'] = df.apply(calculate_c_value, axis=1)
这个代码将根据您提供的条件对数据帧进行计算和更新,为C列填充相应行的值。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-4-17 20:38:55 | 显示全部楼层    本楼为最佳答案   
本帖最后由 歌者文明清理员 于 2023-4-17 20:41 编辑

根据您提供的条件,可以使用如下代码计算C列的值:
import pandas as pd
import re

# 定义一个函数用于从字符串中提取数字
def extract_number(string):
    pattern = r'\d+\.*\d*'
    match = re.search(pattern, string)
    if match:
        return float(match.group())
    else:
        return None

# 定义一个函数用于计算C列的值
def calculate_c_value(row):
    b_value = row['B']
    d_value = row['D']
    if pd.isna(b_value):
        if pd.notna(d_value):
            return float(d_value) / 0.28
        else:
            return None
    elif isinstance(b_value, (int, float)):
        return float(b_value) + 55
    elif isinstance(b_value, str):
        b_number = extract_number(b_value)
        if b_number is not None and pd.notna(d_value) and d_value != '0':
            return b_number / float(d_value)
        else:
            return None
    else:
        return None

# 创建DataFrame并应用计算函数
data = [["2022-12-21",None,"会求数据","-0.40"],
        ["2022-12-20","2.1016","会求数据","-0.77"],
        ["2022-12-19","3698得息56.8","会求数据","-0.77"],
        ["2022-12-18","1.9733","会求数据",""],
        ["2022-12-17","698分得56","会求数据",""],
        ["2022-12-16","","",""],
        ["2022-12-12","","会求数据","-0.40"]]
columns = ["日期","B","C","D"]
df = pd.DataFrame(data, columns=columns)

df['C'] = df.apply(calculate_c_value, axis=1)
这个代码将根据您提供的条件对数据帧进行计算和更新,为C列填充相应行的值。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-4-17 20:40:23 | 显示全部楼层
本帖最后由 sfqxx 于 2023-4-17 20:41 编辑

可以使用Pandas库来遍历DataFrame中每一行的数据,判断B列和D列的情况,并按照题目要求进行相应的计算。

以下是代码示例:

首先下载panda
pip install pandas
import pandas as pd
import re

data = [["2022-12-21", None, "会求数据", "-0.40"],
        ["2022-12-20", "2.1016", "会求数据", "-0.77"],
        ["2022-12-19", "3698得息56.8", "会求数据", "-0.77"],
        ["2022-12-18", "1.9733", "会求数据", ""],
        ["2022-12-17", "698分得56", "会求数据", ""],
        ["2022-12-16", "", "", ""],
        ["2022-12-12", "", "会求数据", "-0.40"]]
columns = ["日期", "B", "C", "D"]
df = pd.DataFrame(data, columns=columns)

def calculate_C(row):
    b_value = row["B"]
    d_value = row["D"]
  
    if pd.isnull(b_value) or b_value == "None":
        if d_value != "":
            return float(d_value) / 0.28
        else:
            return ""
          
    if isinstance(b_value, (int, float)):
        return b_value + 55
    
    if isinstance(b_value, str):
        nums = re.findall(r"\d+\.*\d*", b_value)
        if len(nums) > 0 and d_value != "":
            return float(nums[0]) / float(d_value)
        else:
            return ""
    
    return ""

df["C"] = df.apply(calculate_C, axis=1)

print(df["C"])

代码逐行解释:

首先导入必要的库和定义初始的DataFrame数据。

然后定义一个函数`calculate_C(row)`,该函数形参是一行数据(Series类型),用来计算该行对应的C列的值。对于这个问题中的每种情况,使用`if`语句来检查并分别计算C列的值,并最终返回计算出的
有用请设置最佳答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-4-17 20:40:32 | 显示全部楼层
你好!根据你的需求,可以使用以下代码计算C列的值:
import pandas as pd
import re

data = [["2022-12-21", None, "会求数据", "-0.40"], ["2022-12-20", "2.1016", "会求数据", "-0.77"], ["2022-12-19", "3698得息56.8", "会求数据", "-0.77"],
        ["2022-12-18", "1.9733", "会求数据", ""], ["2022-12-17", "698分得56", "会求数据", ""],
        ["2022-12-16", "", "", ""], ["2022-12-12", "", "会求数据", "-0.40"]]
columns = ["日期", "B", "C", "D"]
df = pd.DataFrame(data, columns=columns)

def calculate_c(row):
    b = row['B']
    d = row['D']

    if (b == "" or b is None) and isinstance(d, str) and d.replace(".", "").isdigit():
        return float(d) / 0.28
    elif isinstance(b, str) and b.replace(".", "").isdigit():
        return float(b) + 55
    elif isinstance(b, str) and re.search(r'\d+', b) is not None:
        first_number = re.search(r'\d+', b).group()
        if isinstance(d, str) and d.replace(".", "").isdigit() and float(d) != 0:
            return float(first_number) / float(d)
    return row['C']

df['C'] = df.apply(calculate_c, axis=1)
print(df)

这段代码首先定义了一个calculate_c函数,用于根据你的条件计算C列的值。然后使用apply方法将此函数应用于数据帧的每一行,计算出C列的值。

运行该代码后,你可以看到更新后的数据帧。希望这对你有所帮助!如果还有其他问题,请随时提问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-4-17 20:58:49 | 显示全部楼层
歌者文明清理员 发表于 2023-4-17 20:38
根据您提供的条件,可以使用如下代码计算C列的值:

这个代码将根据您提供的条件对数据帧进行计算和更新 ...


                               
登录/注册后可看大图
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-4-17 21:29:02 | 显示全部楼层
def calculate_C(row):
    b_value = row["B"]
    d_value = row["D"]
  
    if pd.isnull(b_value) or b_value == "":
        if d_value != "":
            return float(d_value) / 0.28
        else:
            return ""
         
    if isinstance(b_value, (int, float)):
        return b_value + 55
   
    if isinstance(b_value, str):
        nums = re.findall(r"\d+\.*\d*", b_value)
        if len(nums) > 0 and d_value != "":
            return float(nums[0]) / float(d_value)
        else:
            return ""
   
    return ""

df["C"] = df.apply(calculate_C, axis=1)

print(df)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-4-17 21:40:34 | 显示全部楼层

你的代码运行甚至报错
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-23 17:21

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表