Netflix Prize 是2006年Netflix启动的一个机器学习和数据挖掘比赛,旨在解决电影评分预测问题。

训练集包含 480,189 名用户对 17,770 部电影的 100,480,507 份评分,评分为 1-5 分。

qualifying.txt 中包含需要检验的数据,参赛者根据检验集提供的电影id跟用户id,时间进行评分预测,然后提交结果。(不过因为没有关于结果评分的数据,所以这个文件貌似用处不大)

probe.txt 相当于测试集,与 qualifying.txt 的区别在于你可以在训练集中查到对应的评分数据。

结果的评估使用 RMSE。

数据集下载:

论文:

相关文章

参考资料

关于Netflix的一些报道: