数据挖掘(【Web大数据挖掘】推荐系统设计

项目说明Predict the rating scores of the pairs (u, i) in the Test.txt file

dataset:(1) Train.txt，whichisusedfortrainingyourmodels.)2) Test.txt， whichisusedfortest.)3) itemattributute whichisusedfortrainingyourmodels (optional ).)4) ResultForm.txt， whichistheformofyourresultfile.theformatsofdatasetsareexplainedinthedataformatexplanation.txt.notethatifyoucanuseitematematttion heperformanceofthealgorithms，additionalpoints(upto10 ) canbeaddedtoyourfinalcoursescore .实现请求In this project， youneedtoreportthepredictedratingscoresoftheunknownpairs (u，I ) inth etest.txtfile.youcanuseanyalgorithmsyouhavelearnearnedfedfffire . one group (一致认证软件维护)。 needstowriteareportaboutthisproject.thereportshouldincludebutnotlimitedtothefollowingcontents 3360 (1)。基本身份验证工具(e.g .number of users，number of ratings，number of items，etc )； )2)详细信息； )3) experimentalresultsoftherecommendationalgorithms (RMSE，培训时间，空间完成)； (4) theoreticalanalysisor/andexperimentalanalysisofthealgorithms .实现细节1、问题描述

使用赋予train.txt文件的数据，根据用户对不同电影的已知评估，结合协同过滤的思想，预测test.txt文件中的用户对其他电影可能的评估。

2、实验原理

协同过滤(collaborativefilteringrecommendation )技术是推荐系统中应用最早、最成功的技术之一。合作过滤简单来说，就是利用一个兴趣相投、有共同经验的群体的偏好，推荐用户感兴趣的信息。通常，通过使用最近邻技术，使用用户的历史偏好信息来计算用户之间的距离，并且通过使用目标用户对最近邻用户的商品评估的加权评估值来预测目标用户对特定商品的偏好程度，并且基于偏好程度推荐目标用户。这次实验采用了基于item的协同过滤算法。 item之间的相似性是通过为每个用户评估不同的item来评估的，建议基于item的相似性。基于item的协同过滤算法主要分为两个阶段：

1 )计算item之间的相似度

2 )根据item的相似度和用户的历史行为向用户生成推荐列表。因此，可以在表达式(2.1 )中定义item的相似度。

3、数据集统计信息

对给定的train.txt和test.txt文件进行分析和统计后，有关训练集train.txt和测试集test.txt的统计信息分别如下：

1 )培训集培训集train.txt文件中包含的统计信息，如用户数、评分记录和项目数。

2 )测试集测试集表示test.txt文件中包含的用户数、评分记录及项目数等统计信息。

4、算法细节

1 )读取磁盘上的测试集test.txt文件，获取预测用户和用户评估的items；

2 )获取用户后，在训练集中获取每个用户评估的items。这些是用于计算预测得分类似项目；

5、实验结果

项目说明使用语言： Java代码量：联系约850行作者如果项目代码和文档需要，请与作者联系获取。

数据挖掘(【Web大数据挖掘】推荐系统设计 - 预测评分)