鱼C论坛

 找回密码
 立即注册
查看: 211|回复: 4

[Python] sklearn

[复制链接]
发表于 2025-1-13 09:12:06 | 显示全部楼层 |阅读模式
2鱼币
dbscan = DBSCAN(eps=0.4,min_samples = 9)
dbscan.fit(X)
@FishC 麻烦问一下eps和min_samples是什么意思

最佳答案

查看完整内容

DBSCAN 是一种密度聚类算法,全称是 Density-Based Spatial Clustering of Applications with Noise。 在你的代码中,eps 和 min_samples 是 DBSCAN 算法的两个超参数,决定了聚类的结果和噪声点的判定方式。 你可以通过调整 eps 和 min_samples 来优化聚类结果。例如: [*]如果发现很多点被标记为噪声,可以尝试增大 eps 或减小 min_samples。 [*]如果聚类看起来过于密集,可以尝试减小 eps 或增大 min_samples。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2025-1-13 09:12:07 | 显示全部楼层
DBSCAN 是一种密度聚类算法,全称是 Density-Based Spatial Clustering of Applications with Noise。

在你的代码中,eps 和 min_samples 是 DBSCAN 算法的两个超参数,决定了聚类的结果和噪声点的判定方式。

你可以通过调整 eps 和 min_samples 来优化聚类结果。例如:

  • 如果发现很多点被标记为噪声,可以尝试增大 eps 或减小 min_samples。
  • 如果聚类看起来过于密集,可以尝试减小 eps 或增大 min_samples。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2025-1-13 09:12:12 | 显示全部楼层
在DBSCAN(Density-Based Spatial Clustering of Applications with Noise)中,epsmin_samples是两个非常重要的参数,用于确定数据点的核心性和聚类的方法。

eps:(邻域半径)定义了数据点在进行密度聚类时的搜索半径。简单来说,一个点周围距离为eps的区域是它的近邻区域。较小的eps会导致更精细的聚类,较大的eps会导致更大的聚类或合并。

min_samples:(最小近邻点数)定义了一个点成为核心点所需的最少数据点数量(包括该点本身)。一个点的近邻区域内如果包含至少min_samples个数据点,则该点被视为核心点,这意味着它属于一个更密集的聚类。

这两个参数共同定义了什么样的数据点可以聚集在一起形成一个簇。调整这些参数可以影响聚类的效果,需要根据具体的数据集进行调节。


以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2025-1-13 09:13:54 | 显示全部楼层
@FishC 在什么情况下需要用到密度聚类算法呢?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2025-1-13 09:14:03 | 显示全部楼层
xunyu 发表于 2025-01-13 09:13
@FishC 在什么情况下需要用到密度聚类算法呢?


密度聚类算法,尤其是DBSCAN(Density-Based Spatial Clustering of Applications with Noise),在以下情况下特别有用:

1. 数据分布不规则: 当数据集中的簇形状不规则或非线性时,密度聚类效果较好。传统的K-Means等算法在处理非球形簇时可能表现不佳。

2. 噪声数据: 当数据集中存在噪声点或异常值时,密度聚类可以有效识别和隔离这些数据点。

3. 不需要预定义簇的数量: 与K-Means不同,DBSCAN不需要预先定义簇的数量,非常适合于簇数量未知或动态的数据集。

4. 任意大小的簇: 可以发现密度差异较大且大小不等的簇。

因此,在面临上述挑战时,考虑使用密度聚类算法可能会得到更好的聚类效果。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-23 07:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表