首页 > 编程知识 正文

信贷用户逾期数据,信用卡用户画像

时间:2023-05-05 02:41:20 阅读:55787 作者:3190

文章目录确定业务目的确定维度(标签)标签加工效果评价确定业务指标数据分析数据可视化

明确业务目的

广义上,用户图像有两个定义。

一种主要用于产品经理和用户研究者,称为Personas,本质上是用户角色,主要以问卷、电话访谈、数据库聚合运算为探索手段,获取用户定性特征,完成定性分析。 很多产品经理,战略分析只知道看用户图片,那么为什么需要获取用户个性化呢? 产品经理需要知道用户的使用体验,因为单个APP的用户可能有上千万,但无法知道这上千万用户的用户体验。 因此,需要将这千万用户的脸书抽象出来,幻化为几十个(虚数)特征完全不同的顾客; 根据这几十位客户的使用体验,优化APP。 有了用户图像,产品经理在了解用户需求时,只需关注这几十个抽象客户的痛点,就可以降低产品设计的复杂性。 这种用户角色信息一般以excel、ppt、文档等形式存在; 另一种主要用于数据分析师、运营,称为配置文件,本质上是用户配置文件,它将用户特征抽象为多个可量化维度,本质上是对特征变量的量化分析。 例如,针对各用户的年龄、性别、收入、学历等特征,用具体的数值进行数值化; 在进行个性推荐、正确营销、业务预测时,筛选特定的用户群。 Profile是指可以对特定的用户用标签和数据准确地进行记述,也是现在受欢迎的APP应用领域。 这种用户配置文件一般以json、键值对、宽表等形式存在; 根据以上说明,最初的用户图片Personas,主要是产品经理探索APP用户,使用研究小组探索贷款用户,资金方探索借款组,最终将数据整理成报表形式的文件,实现APP的使用体验这种工作开发难度较低,基于Hive-QL在数据仓库中取数、汇总后进行数据可视化和报告即可。

第二个用户图像简档是当前流行的用法,简单来说是标记每个用户,标签是通过分析用户信息而高度复杂的特征标志,并且由特征类型和可能的值组成。 可用于推荐系统、精准营销、逾期预测等领域。 这类工作要经过维度确定、标签加工、数据发布、算法落地、AB测试、正式上线等阶段。

确定维(标签)的维通常有两个要求。

意思很明确。 每个标签只有一个意思,避免标签之间的重复和冲突,避免信息冗馀,很容易理解。 标签的名称和值范围是技术人员容易理解的,用户图像中常见的7个维度:

静态标签是基本稳定的数据,一构建就可以不用长时间更新,标签有效期一般在一个月以上,用户填写,给爬虫许可获取,还有性别、年龄、收入、行业、受教育程度、有无婚姻、联系方式、地址、手机也可以通过标签扩散方式推测获取是否绑定银行卡、是否允许注册、是否允许淘宝、是否允许银行流水、是否允许手机话费查询等基本信息。 位置特征:用户所在城市、居住区域、用户移动的GPS轨迹等、户籍所在地等; 设备特点:所用终端特点等,mac、操作系统类型、手机型号等; 动态标签、经常变化的数据,一般需要每天更新。 填充点数据、外部数据源获取兴趣特征。 阅读内容、收藏内容、阅读咨询、品牌偏好、购物偏好等消费特征:收入状况、购买力水平、已购买商品、购买渠道偏好、最终购买时间、购买频率等; 行为特征:访问时间、浏览路径等用户网站行为日志、积分数据嵌入、借款金额、借款期限、借款利率、坏账日期、初始风险评估、产品类型、贷款用途、有无首次贷款、历史借款金额、历史借款次数、 当前订单是否还本金、当前订单是否还利息、历史借款次数、历史正常还款期数、历史未还款期数、历史未还款期数社交特征:圈子、互动行为等具体到财富管理、P2P理财销售的用户画像因为资产管理APP的内容往往很简单,不像某些社交APP和娱乐APP那样吸引用户很长时间,所以没有非常多的嵌入数据; 同时,用户的需求也往往很明确。 也就是说,只是在自己的预期利率、预期期限、预期投资额的范围内选择产品。 因此,理财投资行为具有金额大、频率小、再投资意愿高、操作快速简单、金融属性强于互联网属性的特点。

综合分析,根据理财销售的业务特点,总结出用户图片维度如下。

自然特性:姓名、身份证、手机号码、年龄、性别、户籍地址、年收入、工作行业、受教育程度、婚姻状况、地址、工作地址、手机号码归属地址、是否允许银行卡、手机查询等设备特征:设备信息、设备类型、设备imei、mac地址、IP地址、操作系统; 行为特征:订单号、贷款金额、贷款期限、利率、期限、当前还款金额、当前剩余还款金额、客户评级、是否首次贷款、历史贷款金额、历史贷款次数、历史平均贷款利率、历史平均贷款期限、银行卡类型、贷款期限号数; 在这样的特征数据的存储中,可以使用HBase,适合稀疏场的处理; 但是,我对Hive很了解,所以用Hive加工,每天更新。 实际上,静态标签还可以接受一个月更新一次。 动态标签需要每天更新,但是集群的计算能力合格,所以每天更新也没关系。

标签加工基于数据仓库上游表,基于Hive-QL计

算出静态标签表。每日自动调度即可。

效果评估

如果没有直接验证结果标签的有效性,就直接上线测试,风险性是很大的。一般在上线之前,采用小流量的AB测试进行验证;在验证早期,可以通过点击率、阅读时长等指标验证标签的有效性。

若小流量AB测试证明有效,则可以采用最直接的评估方法:即对实际业务的提升。例如,互联网广告投放中,主要是看用户画像上线之后,点击率和收入的提升;精准营销则是看销售额的提升等。

除了AB测试之外,还经常采用抽样的方式。千万级或者上亿用户的情况下,不能一一验证,因此可以采取分层抽样或者随机抽样的方式

确定业务指标

每日投资金额、投资笔数、投资笔均、逾期率、不良贷款率

数据分析

1、输出分析报告;
2、构建信贷用户风险体系;

数据可视化

待补充

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。