造梦师pot 发表于 2023-6-11 10:47:43

问号里面填什么

#计算 表NotFraud 的相关性

# 这里计算 除 fraud列 的剩余7列的相关性,因为 fraud是标签不算特征
corr_NotFraud = ???
# 查看计算结果
corr_NotFraud

isdkz 发表于 2023-6-11 10:48:40

你的问题中没有提供具体的数据集名称,但假设你的数据集名为df (且数据集中的fraud列是你的目标变量),你应该要创建一个没有fraud列的子数据集,然后计算这个子数据集的相关性。以下是相应的代码:

# 创建一个新的数据集,这个数据集不包含 'fraud' 列
NotFraud_df = df.drop(columns=['fraud'])

# 计算这个新数据集的相关性
corr_NotFraud = NotFraud_df.corr()

# 查看计算结果
corr_NotFraud


这段代码将会返回一个相关性矩阵,其中的每个元素表示对应两个列的相关性。相关性的范围在 -1 到 1 之间,-1 表示完全负相关,1 表示完全正相关,0 表示没有关联。

造梦师pot 发表于 2023-6-11 10:53:04

isdkz 发表于 2023-6-11 10:48
你的问题中没有提供具体的数据集名称,但假设你的数据集名为df (且数据集中的fraud列是你的目标变量 ...


---------------------------------------------------------------------------
NameError                                 Traceback (most recent call last)
Cell In , line 2
      1 #计算 表NotFraud 的相关性
----> 2 NotFraud_df = df.drop(columns=['fraud'])
      3 # 这里计算 除 fraud列 的剩余7列的相关性,因为 fraud是标签不算特征
      4 corr_NotFraud = NotFraud_df.corr()

NameError: name 'df' is not defined

isdkz 发表于 2023-6-11 10:53:54

造梦师pot 发表于 2023-6-11 10:53
---------------------------------------------------------------------------
NameError         ...

把 df 替换成你的数据集的名称

sfqxx 发表于 2023-6-11 11:11:11

你可以使用`Pandas`库中的`corr()`函数来计算除了`fraud`列外的DataFrame的相关性系数矩阵。请尝试以下代码:

corr_NotFraud = df.drop('fraud', axis=1).corr()
这将从名为`df`的DataFrame中删除`fraud`列,然后计算其余7个特征列之间的相关性系数矩阵,并将其存储在名为`corr_NotFraud`的变量中。

请注意,`.drop()`函数用于删除意味着它会返回一个不包含指定列的新DataFrame。我们还通过提供轴参数`axis=1`来告诉函数我们要删除一个列,而非一行。

而且,请把df 替换成您的数据集的名称


给个最佳答案{:10_254:}
页: [1]
查看完整版本: 问号里面填什么