问号里面填什么
#计算 表NotFraud 的相关性# 这里计算 除 fraud列 的剩余7列的相关性,因为 fraud是标签不算特征
corr_NotFraud = ???
# 查看计算结果
corr_NotFraud 你的问题中没有提供具体的数据集名称,但假设你的数据集名为df (且数据集中的fraud列是你的目标变量),你应该要创建一个没有fraud列的子数据集,然后计算这个子数据集的相关性。以下是相应的代码:
# 创建一个新的数据集,这个数据集不包含 'fraud' 列
NotFraud_df = df.drop(columns=['fraud'])
# 计算这个新数据集的相关性
corr_NotFraud = NotFraud_df.corr()
# 查看计算结果
corr_NotFraud
这段代码将会返回一个相关性矩阵,其中的每个元素表示对应两个列的相关性。相关性的范围在 -1 到 1 之间,-1 表示完全负相关,1 表示完全正相关,0 表示没有关联。 isdkz 发表于 2023-6-11 10:48
你的问题中没有提供具体的数据集名称,但假设你的数据集名为df (且数据集中的fraud列是你的目标变量 ...
---------------------------------------------------------------------------
NameError Traceback (most recent call last)
Cell In , line 2
1 #计算 表NotFraud 的相关性
----> 2 NotFraud_df = df.drop(columns=['fraud'])
3 # 这里计算 除 fraud列 的剩余7列的相关性,因为 fraud是标签不算特征
4 corr_NotFraud = NotFraud_df.corr()
NameError: name 'df' is not defined 造梦师pot 发表于 2023-6-11 10:53
---------------------------------------------------------------------------
NameError ...
把 df 替换成你的数据集的名称 你可以使用`Pandas`库中的`corr()`函数来计算除了`fraud`列外的DataFrame的相关性系数矩阵。请尝试以下代码:
corr_NotFraud = df.drop('fraud', axis=1).corr()
这将从名为`df`的DataFrame中删除`fraud`列,然后计算其余7个特征列之间的相关性系数矩阵,并将其存储在名为`corr_NotFraud`的变量中。
请注意,`.drop()`函数用于删除意味着它会返回一个不包含指定列的新DataFrame。我们还通过提供轴参数`axis=1`来告诉函数我们要删除一个列,而非一行。
而且,请把df 替换成您的数据集的名称
给个最佳答案{:10_254:}
页:
[1]