鱼C论坛

 找回密码
 立即注册
查看: 3248|回复: 3

【机器学习】二分类knn模型的k值选取有什么特殊讲究吗?

[复制链接]
发表于 2019-6-10 19:19:36 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x

通常先取一个较小的k值,然后再用交叉验证法优选,还有什么需要考虑的吗?
TIM截图20190610191846.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-6-10 21:30:47 | 显示全部楼层
很简单,就是寻找最优超参数,sklearn代码:
from sklearn.model_selection import GridSearchCV

param = [
    # 第一个表示不考虑距离
    {
        "weights": ["uniform"],
        "n_neighbors": [k for k in range(1, 6)],
    },
    # 第二个考虑距离,比如欧拉距离、闵可夫斯基距离
    {
        "weights": ["distance"],
        "n_neighbors": [k for k in range(1, 6)],
        "p": [p for p in range(1, 4)]
    },
]

knn = KNeighborsClassifier()
# n_jobs(启动多核计算), verbose(输出详细信息)
g_s = GridSearchCV(knn, param, n_jobs=-1, verbose=2)  
g_s.fit(x_train, y_train)
print(g_s.best_estimator_)
print(g_s.best_score_)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-11 07:52:37 | 显示全部楼层
什么叫2类别的,,
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-6-11 08:23:53 | 显示全部楼层
一般取值3-5就差不多了,具体要根据数据集的分布情况来定,所以都是设定范围搜索最优解
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-17 04:10

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表