另一方面,用户流失的定义,对于用户何时流失、为什么流失,无论是电商平台、租赁服务、新零售业务、电子游戏领域,都备受关注。
一般用户流失定义为在一段时间内(一般是平均用户接受服务次数的n倍的时间)没有接受再服务。 市场因行业而异,但对流失的意义在于以后基本都不会再次再本平台获取服务。
2 .很多人认为流失不是属性,而是组合行为的结果建模时,把我最终想要的目的作为结果放入模型就能导出结果。 但是,如果以一个组合的结果为目的,就容易引起逻辑上的错误。 例如,如下所示
连续投三次骰子也等于1的概率是1/216已知的前两次为1,连续三次为1的概率是1/6,这是与流失用户相关的上下文。 在分析手机游戏的用户流失时
一个用户第一次登录后可能会流失的是1/216一个用户在三天内不登录游戏而流失的概率是1/6此时两个不同的问题
在一个用户最初登录游戏,然后填写信息后,我想知道他的流失概率。 当一个用户创建了三天的行为数据(游戏中的行为,有无登录行为)之后,对于问题1,你会发现他是否有流失概率,其实非常简单,只要对人群进行分类就可以得到结果。 模型训练(模型训练只是为了提供扩展属性,可以得到非常规则的统计等直观的信息)。
3 .问题2的展开假设对应社区团购超市三个多月没有购物,即使是该客户的流失,也会判断逻辑是否会自我接触。 另外,预测周期是以周为单位的,我们对每个顾客最近一年的一系列行为指标(购物、平台访问、旅行、聊天)和属性(性别、年龄、有无结婚)进行建模,考虑:
必然,3358www.Sina.com/是一个强相关指标,排除在外,如果大部分上周刚购物的人包含在下周流失的用户中,预计该指标作为强相关指标容易降低其他所有指标属性的影响力,你的问题是
四.如果要区分行为和属性以其他方式提问,请访问用户上一次消费是否在最近2个月3周内
这些问题容易被一个客户的属性、指标回答,在逻辑上是自我接触的。
此外,这些客户和该用户是否为流失用户的组合将成为确定是否存在流失的标志。
5 .如果选择径流,也有模型。 可以考虑以下数据。
100人中,93名玩家本周被定义为流失玩家。 (最近三周没有玩游戏被定义为外流。 )根据上周的行动指标和属性判断100人是流失玩家,最终如下图所示得分。
哇! 高分啊。
但其实我们判断的条件很简单,只要看他前两周有没有玩游戏,否则就会被判断为流失的玩家。
其实这也引起了另一个问题
哪些用户会在下周进行消费?关于这类问题,网上有很多解决方案。 请作为参考。
机器学习中如何处理不平衡数据集?
《机器学习实战》 (不平衡分类问题(召回率/ROC/AUC/采样方法) ) ) ) ) ) ) )。