:的部署随着互联网时代的发展,数据量的产生越来越多,如何利用呢? 首先,对最常用推荐系统的几种算法进行说明和区分
丶基于统计学的推荐概要:
基于统计学的推荐系统,实际上是针对大量的历史数据,根据自己的业务需求获取想要的信息
例如:
是统计学推荐的应用,如热门商品排行榜、近期热门商品排行榜、平均商品分数获得最佳商品等
卡2基于协同过滤的推荐概述:
基于协同过滤的推荐分为:
用户协同过滤推荐、物协同过滤推荐、“隐性语义”模型协同过滤推荐
1 .基于隐含语义模型的推荐概述:
隐语语义模型就像玄学一样,基于用户已经评估了过多的数据,找出一些联系,得到一个模型,预测测试集的数据。 这种不可思议的关系就像“啤酒和奥的斯”放在一起就很畅销一样
1 .根据训练集数据,训练ALS模型
2 .利用模型预测和评价数据
3 .找到分数最高的几个,这样就可以提取用户的推荐列表
1 .使用已经训练过的模型,针对数据生成特征值
2 .将生成的特征值转换为矩阵
3 .计算相似度,计算商品相似度矩阵
2 .基于物品的协同过滤推荐概要:
基于物品的协同过滤是基于用户的行动数据,得到商品间的相似度的。 例如,如果调查用户a购买了商品b,此时用户c也购买了商品b,购买了商品d,则此时通过计算"共现相似度"得到相似度列表
1 .物品协同过滤相似度,又叫 "同现相似度"
2 .这个优点是,不用提取物品的原始数据的特征,只需要行动数据就可以了
3 .基于用户的协同过滤推荐概述:
首先,寻找与目标用户相同喜好的邻居,并根据目标用户邻居的喜好用商品推荐目标用户
在这里还没有遇到实例,所以简单地这样概述一下
丶基于内容的推荐概要:
根据商品的数据信息,进行特征提取(TF-IDF ),计算相似度,得到商品的相似度列表。 特征提取一般是对类型丶标签进行的
冷启动问题:
我们使用实时推荐,或者离线模型的时候,这个时候会有新的用户来,对任何行为数据都没有。 这时,我们发生了冷启动的问题。
解决方案:
我们可以先根据统计学进行替代,也可以根据用户的兴趣进行推荐