鱼C论坛

 找回密码
 立即注册
查看: 2975|回复: 9

我是新手,帮看下怎么做,悬赏10鱼币

[复制链接]
发表于 2014-9-11 18:34:26 | 显示全部楼层 |阅读模式
10鱼币
    最近在做个数据稀疏性处理,三个字段Uid,Iid,Rui,Uid表示用户,Iid表示项目,Rui表示用户u对项目i的评分。因为用户u不可能对所有的项目i评分,所以我要做的是把用户u没有评分的项目i做个估计值Rui。首先说一下,我的数据在txt文本文档的格式如下(用户数、项目数是个定值):



下面有三种处理方式:第一种是,空值根据此用户u评分平均值代替;第二种是,空值根据此项目i评分平均值代替;第三种,空值根据前两项的平均值再平均。不知道我说清楚了没,我分别举个例子。假如有5个用户,8个项目,用户U1对I2、I3、I4、I5的评分时1、2、3、4,那么根据第一种做法,U1对I1、I6、I7、I8的评分估值应该为(1+2+3+4)/4 = 2.5,注意此时R11=2.5;假如I1被用户U2、U3、U4的评分是1、2、3,那么I1被用户U1、U5的评分估值为(1+2+3)/3 = 2,注意此时R11=2;按照第三种做法,R11 = ((1+2+3+4)/4 + (1+2+3)/3) /2= 2.25。最后按照原始数据格式输出所有的数据,应该是5*8 = 40行。

最快给我的可以追加分,谢谢~





原始数据格式

原始数据格式
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2014-9-11 18:35:03 | 显示全部楼层
原始数据的格式是下面的图片
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2014-9-11 18:37:22 | 显示全部楼层
应该发到python板块的,需要python解决,版主能给移到那里吗
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2014-9-12 17:22:16 | 显示全部楼层
高级啊,暂时看不懂。。。
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2014-10-20 23:04:57 | 显示全部楼层
我也看不懂
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2014-11-24 16:10:44 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2014-11-26 11:21:27 | 显示全部楼层
帮顶
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2014-11-27 16:23:44 | 显示全部楼层
哦哦哦
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2014-12-2 11:39:45 | 显示全部楼层
学习学习,同样是新手
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2014-12-4 10:34:58 | 显示全部楼层
同样看不懂
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-11-16 00:35

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表