在工作中,我们常常需要分析各种数据。不同的数据分析方法要怎么用呢?本文作者根据自己的自身经历,从四个角度进行分析介绍,推荐给对数据分析感兴趣的童鞋阅读。
(相关资料图)
作为业务部门的数据分析师,经常面临的场景就是分析异常。
比如老板找到你说:“小伙,帮我分析下最近一周的GMV下降的原因。”很多人拿到这个问题的时候就开始直接去找各个维度来拆分看了,最后还是一脸茫然。
首先拿到这个问题时,我们需要用分析方法,描述和对比分析法。就是采用描述性分析方法,看具体的GMV值下降了多少,以及采用趋势和对比的方法来判断是不是真正的异常,有可能去年同期也是节假日后的正常下降。
这个过程就像侦探探案时了解一些案发现场的基础信息。在对异常有了基础认知之后,想要了解真相,需要细分的思维方法,一步步分解还原案发的蛛丝马迹。但是怎么细分,以及按照什么样的套路细分是有讲究的。首先介绍细分常见的方法,笔者将其归纳为3类。通常在分析一个具体问题中可能会多种一起使用。
第一类是按照结构进行细分:
事物或组织本身的结构;产线的区分(如化妆品类,生鲜类等),区域的区分(如华东/华西/华南大区),渠道的区分(APP/小程序/PC端)等。杜邦分析法,是杜邦公司发明的,采用金字塔结构,把企业净资产收益率逐级分解为多项财务指标的比值或乘积。
这个借鉴于我们常规的指标体系的分析中。比如,在文首遇到的那个情景,GMV同比下降30%,可以按照杜邦分析法进行指标拆解,定位是UV少了,还是cr下降了,还是客单价降低主要影响。
分组分析法,根据一定标准对研究对象进行分组。
分组分析法分为属性指标分组和数量指标分组。而属性指标所代表的数据不能进行运算,只是说明事物的性质、特征。如人的姓名、部门、性别、文化程度等指标,可以按照一定规则分组,比如页面引流中对于同组织下:内部引流,其他为外部引流。
数量指标所代表的数据能够进行加减乘除运算,说明事物的数量特征,比如人的年龄、工资水平、企业的资产等指标,例如年龄属性:1-17:青少年,18-35青年,35-55中年,55以上老年;
矩阵分析法,又称四象限分析法,源自著名的BCG矩阵,多用于产品组合战略分析中,实现产品及资源分配结构的良性循环,明星/现金牛/廋狗/问题产品。
在分析场景中,可以用来评估两种因素对于不同组的影响差异时,识别不同组间不同的业务策略。比如,评估业务中各个大区的GMV占比vsGMV同比增长率,识别到重点核心大区和有机会的大区。
第二类是时间(流程)维度:
时间颗粒度下的细分,按年/月/周/日对齐的方式细分看异常是否集中于某一时间段。
漏斗分析法,这是互联网用于行为分析中使用较多的分析法,分析从潜在用户到最终用户这个过程中用户数量的变化情况,确定整个流程的设计是否合理,各步骤的优劣,和是否存在优化的机会。
客户生命周期的方法,主要应用的场景是用户运营,聚焦不同阶段用户运营的策略,平时接触不多,就不展开。
第三类是程度分析方法,聚焦关注重点:
ABC分析法,又称帕累托图法。据事物在技术或经济方面的主要特征,进行分类排队,分清重点和一般,从而有区别地确定管理方式的一种分析方法。
A类是我们重点关注的。比如可以在平台上去识别A类SKU带来累计GMV达80%,B类和C类占比剩余20%,理清楚平台的重点品类。
A类因素,发生累计频率为0%~80%,是主要影响因素。B类因素,发生累计频率为80%~90%,是次要影响因素。C类因素,发生累计频率为90%~100%,是一般影响因素。案例使用:在日常指标分析过程中,一般常用的是杜邦分析,结构细分和漏斗想结合的方式来定位异常点。
我们通过定位发现近期GMV的下降,首先拆解日期来看,没有集中在哪一天有异常;通过杜邦分析法拆解为UV*cr*客单价三个部分,定位到是转化率cr的下将是主要影响成分。拆解cr的过程,按照 详情页-填写页-提交订单-支付订单漏斗流程中去拆解发现是在填写页到提交订单这个过程转化率下降。使用常见单维度因素去识别:平台(APP/H5/PC),主要影响是APP,产线(门票/跟团/酒店)无差异;拆解ios/安卓系统,版本维度拆解去看是否对这个过程的影响;识别到时填写页验证码有bug导致这个步骤转化率变低,从而识别到改进点。以上这个案例是将平时的分析过程进行了简化,但是方法和套路是不变的,多加练习,用好细分分析手法,拆解定位问题信手拈来。
下图附上我整理的原因分析方法的思维导图。
关键词: