首页 > 编程知识 正文

数据分析,平台数据分析维度

时间:2023-05-03 22:11:25 阅读:54080 作者:2207

导读:数据分析是指从杂乱的数据中提取、归纳、归纳某些核心指标,找出某些规律。 但是,往往得出的结论不足以支撑下一步的行动,费了很大的力气,结果还是没有结果,还要继续深入。 本论文不是从专业的数据分析方法论,而是从研究开发的角度对自己进行的数据分析进行思考和总结的。

什么是数据分析

数据分析实际上有“businessintelligence”,简称“BI”这个很高的名字。 通过统计学等方法对观察、测量、实验以及生产活动过程中产生的数据进行总结、归纳、理解,得出一定的结论,用于发现业务中的问题、验证一定方向的正确性、可视化业务现状等。

数据分析工作很痛苦。 必须从杂乱的数据中提取、归纳、归纳某些核心指标,找出某些规律。 另外,经常得出的结论不足以支撑下一步的行动,费了很大的力气最终也不会结果,还必须继续深入。 专业的数据分析师除了SQL脚本外,还经常需要数学、统计学、概率论、算法等专业知识的支持。 作为研发工程师,日常数据分析往往不需要那么多专业知识,但比做编码工作要痛苦得多。

为什么研发要做数据分析数据分析据说是指BI工程师,但现实中BI们往往对业务方面最关心的数据、最关心的问题等方向进行分析。 我觉得你做一个小日常,看看这个小功能上线后的表现是自己的事; 此外,数据分析是一门复杂的学科,需要不断探索,思维方向因人而异。 从开发的角度考虑开发,“行走江湖、多技能”,做很多事,很有可能打开新世界的大门。

我认为研究开发往往基于以下目的。

经常到讲清价值:报告季,必须总结整理这半年KPI完成的情况。 例如,让某个功能有多有效,你怎么测量? 开发周期缩短了多少? 投入者/日减少了多少? 运用了某种功能,在他们使用的时候起到了多少效果? 正确地量化这些数字,将证明最有价值。

理清方向:蚂蚁的开发通常是许多并行的。 通常目标是多个,事情也很多。 有这么多事情排列在一起,比如业务需求、技术改造、安全生产、提高效率等,往往就没有优先级了,让我们来看看数据吧。 看看哪个最紧迫,哪个优先级最高。

发现问题:如果现在的业务遇到瓶颈,不知道下一步的方向在哪里,那么最好提取数据,看看现在的瓶颈是用户的增长还是某种转化率,然后再做

加深思考:这部分不言而喻,老板们对数据都很敏感。 我们也必须向上司学习。 从数据中发现问题的解法,会加深对业务的理解

怎么做研发角度的数据分析这一部分结合我们拍卖业务的“拍摄率”目标整理我的分析过程。

3358 www.Sina.com/http://www.Sina.com/http://www.Sina.com /

什么是拍摄率? 在拍卖业务中,用户在最终成交之前经历了几个步骤:“看照片”-“订阅商品”对商品“支付保证金”-对商品“出价”-赢-履约。 如果有给某个商品定价的用户,那个商品一定会被拍摄。 拍摄率为有报价的商品数/全部商品数。

公式建立后,必须开始分析两个因子。 所有商品的数量来自业务方面的供应。 从BD收到了多少商品作为技术几乎难以影响。 实际上,我们可以做出对商品要求的指导性决定。 BD辛苦说出来的资产够不到平台,这不是没有道理的。

那么,我们可以尽量加大有报价的商品数量。 从变频料斗的角度来看,我们的核心操作是提高看拍品的绝对值,增加之后各路线的转化率。 但是,由于拍品大部分是大资产,笔单价几十万个级别,所以理想的转换料斗的实际操作非常复杂。 所以我们团队做了很多数据分析。

3358 www.Sina.com/http://www.Sina.com/http://www.Sina.com /

(这里是模拟数据)

公式已经定义,数据分析的一步是将该公式实现为报告,看看当前该指标的现状如何。

这一步是常规操作,我们很快做了近两年拍摄率的大盘子,但新的问题又出现了。 由于拍卖业务的特殊性,大盘形成后,这个指标的波动特别大,没能指导我们的后续动作。 我必须在那里进行分析。

3358 www.Sina.com/http://www.Sina.com/http://www.Sina.com /

上式知道拍摄率其实可以分解为两个因子。 有优惠商品数量和全部商品数量。 下面,我们来展开这两个指标。 例如:

按类别分类的优惠商品数量和所有商品的情况

按阅读数据、订阅数据、保证数据查看哪些因素与报价最相关,中间转化漏斗情况

大型资产商品的地区信息很重,我们再看

不同地区的情况

当然还要看不同时间的情况,比如春节、国庆等特殊时期或者双促时,拍下率基本是下跌的

此外还要看未拍下的商品与拍下的商品有什么区别,货真的不好吗?比如市场价100万的房子,起拍价200万,那么肯定是拍不下的,价格因素会大大影响拍下率

还有从用户维度去思考,比如拍下房产的用户他们的购买力情况、在拍卖的行为(首次来拍卖、首次浏览、订阅、交保、出价)、是否有复购行为,是否是企业用户或者投资客等等

前面这些情况其实我们从货的角度、人的角度、时间、地理位置等等各个因素去入手,尽可能的发现问题,但是我们会发现按这个思路把问题拆解下去,维度是无限的,要适时总结,得出可以指导下一步动作的结论就好。

  归纳、总结

如何做好归纳总结这一步其实比前面的数据分析更重要,我理解最关键的点是“相关性”,一旦当前的数据已经和你最初的问呈现较为明显的正向相关,基本就可以了。


分析拍下率的问题中,我们得到了三个因素相关性很高,我们称为影响拍下率的三座大山:

批量拍品:拍卖的业务中存在大量的机构一下子发几百套房子,但最终拍下很少,这类case会造成拍下率极不稳定。一旦这种拍品出现会发现我们站内的流量基本都是不足的,因此我们采用短信、push、外呼等主动触达手动再加上算法挖掘为这类拍品补足流量。

腰部拍品:我们的拍品结构很复杂,有价格很低的房子(比如1元起拍的、11.11元起拍的等),这种房子我们定义为头部商品;相反那些和市场价基本持平甚至超出市场价的很多的,基本大概率卖不出去,我们定义为尾部商品;中间的那一些就是腰部商品,分析中发现这部分腰部商品结构变化造成了拍下率波动。(真实的腰部拍品定义其实不光是价格因素,这里只是简单举例)。

因此我们在站内通过流量补足、站外主动触达的手段进行流量补足,来尽量促成这部分拍品向头部转化,最终成交。看拍下率数据时,我们也会将拍品分层次去看。

除此之外,上面的流量调控也只是针对对流量敏感的商品,但是针对特殊商品,比如大额股权、船舶、土地等小众商品,对流量不敏感,我们会用人工撮合的方式来处理。

地理位置:比如同样的房子,杭州的用户心智较成熟,对应的杭州的房子就比较好拍下,拍下率就远比其他地方高。相比某个地区的三四线城市,拍下率就很低,我们在分析问题时,也会不同地区的拍下率分开处理。

比如,三四线城市,我们正在模式站外广告、传媒广告、线下服务等多种方式特殊处理。

拍下率相对稳定的一二线城市,我们更多在做扩大拍品供给,打造用户心智等。

▐  验证迭代

上面经过归纳总结,我们得到了一些关键动作:

站内对腰部商品做流量调控,这块主要依赖我们导购端的流量调控能力。调控实施时,也要基于头部商品拍下率不变,然后把过剩的流量向腰部商品倾斜,也做了很多数据工作来也验证策略的有效性。

站外对批量拍品进行货找人,然后通过主动触达的方式进行流量补足,召回的子项目也建设了很多数据报表,来衡量对这部分拍品的贡献。
最后,除了一些子项目的效果追踪,我们还要不忘初心,反过来看大盘的拍下率有没有变化,看看我们最初的问题有没有得到解决。

总结

总体来讲,数据分析就是一个总-分-总的过程:

第一个总是要从总的目标出发,开始拆解、细化

分则是围绕大目标不断细分向下,从尽可能多的角度看待问题

第二个总则是适时回归本心,不能光做了分析而没有结论

数据分析的道路永无止境,1个问题可以拆出N个指标,N个指标相互聚合又会有N*N个指标,分析过程中又会出现M新个指标……,所以适时做归纳、总结,看看当前结论是否可以支持最初的问题,指导下一步的行动、得出有效结论即可。

回归到开发视角,做数据分析的前提是要有数据,开发过程中,除了基础的业务模型设计,还要考虑多记录一些日志,比如接口耗时、必要的报错信息、可辅助数据分析的一部分业务数据、一些关键节点的行为日志等等。

最后,多思考为什么?为什么我的主管会定某个指标为目标?我所负责的部分对这个目标有哪方面的帮助?团队中其他人的部分怎么配合起来共赢,他们的子目标是什么?站在更高的角度思考这些问题,对业务、数据、技术的理解都会更通透。

淘系技术部-阿里拍卖技术部

阿里拍卖是全球超大活跃的在线拍卖平台,GMV 规模超过 6 千亿,年服务消费者 2 亿,一年成交 10 万套二手房。年平均营收增长 100% 以上,万亿蓝海市场赛道独角兽,中国5亿新中产的网购顶级俱乐部。阿里拍卖技术部是一支拥有前端、后端、测试、算法等全建制技术团队,人数70+,我们既有背靠淘系技术设施的优势,又有结合独特拍卖行业特性的行业技术解决方案。

招聘岗位:JAVA开发、算法、前端、测试、客户端
内推邮箱:jianping.xwh@alibaba-inc.com

✿  拓展阅读

作者|qfdsw(一予)

编辑|橙子君

出品|阿里巴巴新零售淘系技术

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。