Netflix Prize 是2006年Netflix启动的一个机器学习和数据挖掘比赛,旨在解决电影评分预测问题。
训练集包含 480,189 名用户对 17,770 部电影的 100,480,507 份评分,评分为 1-5 分。
qualifying.txt 中包含需要检验的数据,参赛者根据检验集提供的电影id跟用户id,时间进行评分预测,然后提交结果。(不过因为没有关于结果评分的数据,所以这个文件貌似用处不大)
probe.txt 相当于测试集,与 qualifying.txt 的区别在于你可以在训练集中查到对应的评分数据。
结果的评估使用 RMSE。
数据集下载:
论文:
- Yehuda Koren,The BellKor Solution to the Netflix Grand Prize
- A. Töscher, M. Jahrer, R. Bell,The BigChaos Solution to the Netflix Grand Prize
- M. Piotte, M. Chabbert,The Pragmatic Theory solution to the Netflix Grand Prize
相关文章
- Netflix Prize and SVD 这篇文章对获奖算法做了比较详细的讲解
- Predicting movie ratings and recommender systems一份关于Netflix Prize的195页专刊
- 关于Netflix Prize的总结(翻译)
- Winning the Netflix Prize: A Summary
- Netflix推荐系统:从评分预测到消费者法则
- 《推荐系统 技术、评估及高效算法》第5章 协同过滤算法的高级课题
参考资料
关于Netflix的一些报道: