鱼C论坛

 找回密码
 立即注册
查看: 3747|回复: 3

【机器学习】二分类knn模型的k值选取有什么特殊讲究吗?

[复制链接]
发表于 2019-6-10 19:19:36 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x

通常先取一个较小的k值,然后再用交叉验证法优选,还有什么需要考虑的吗?
TIM截图20190610191846.png
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-6-10 21:30:47 | 显示全部楼层
很简单,就是寻找最优超参数,sklearn代码:
  1. from sklearn.model_selection import GridSearchCV

  2. param = [
  3.     # 第一个表示不考虑距离
  4.     {
  5.         "weights": ["uniform"],
  6.         "n_neighbors": [k for k in range(1, 6)],
  7.     },
  8.     # 第二个考虑距离,比如欧拉距离、闵可夫斯基距离
  9.     {
  10.         "weights": ["distance"],
  11.         "n_neighbors": [k for k in range(1, 6)],
  12.         "p": [p for p in range(1, 4)]
  13.     },
  14. ]

  15. knn = KNeighborsClassifier()
  16. # n_jobs(启动多核计算), verbose(输出详细信息)
  17. g_s = GridSearchCV(knn, param, n_jobs=-1, verbose=2)  
  18. g_s.fit(x_train, y_train)
  19. print(g_s.best_estimator_)
  20. print(g_s.best_score_)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-11 07:52:37 | 显示全部楼层
什么叫2类别的,,
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-11 08:23:53 | 显示全部楼层
一般取值3-5就差不多了,具体要根据数据集的分布情况来定,所以都是设定范围搜索最优解
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-7-6 14:53

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表