- Power BI零售数据分析实战
- 郑志刚
- 4909字
- 2023-06-29 17:37:02
1.3 零售行业常用数据分析模型
本节介绍在零售行业经常使用的8个用于定量分析的数据分析模型。
1.3.1 帕累托模型
帕累托模型,又称“ABC分析法”或者“二八法则”,是由意大利经济学家帕累托提出的。它指的是在任何一组事物中,通常最重要的部分只占到大约20%,而其余的80%尽管是多数,但却是次要的。例如:80%的财富掌握在20%的人手中,80%的业绩通常来自20%的客户贡献等。
该模型运用在零售数据分析中,比如多门店连锁经营,可以分析重点门店的销售额对整个公司业绩的贡献程度,前20%的门店能否贡献80%的业绩,或者 80%的业绩是由前多少百分比的门店贡献的。重点门店业绩累计贡献占比过低,说明整个连锁系统缺少核心的标杆门店,无法形成强有力的品牌效应;贡献过高则说明销售过于集中在几家重点门店,其他门店和第一梯队差距过大,风险过于集中。而对门店进行 80/20 分类后,管理人员可以将有限的精力更加高效地分配在重点门店,产生最优价值。
针对产品也可以进行帕累托分析。比如具体到某个品类,80%的销售业绩是否由前20%的产品贡献。如果贡献 80% 业绩的产品占比明显高于 20%,说明订货偏向保守,具有畅销款潜质的产品未加深定量;如果小于或等于20%,除非重点单品真的是匠心独运的优质商品,否则说明订货略显激进,销售业绩都集中在了前几款产品上,存在较大风险。图1-44展示了卫衣品类各款色的销售额及累计销售额占比,共计20个款色。其中前7个款色累计销售额占比65%,款色数占比35%,属于重点单品,较好地契合了“二八法则”。
图1-44 卫衣销售额帕累托分析
1.3.2 波士顿矩阵模型
波士顿矩阵,又称“四象限分析法”,由美国著名的波士顿咨询公司创作。它的主要思想是,在分析事物时,从两个不同的维度着手考虑,通过两个维度的相互作用,产生4种不同的类型,从而将事物划分在4个象限中,针对不同象限中的事物采取不同的策略。
比如进行产品分析时,可以按照市场占有率和销售增长率将产品划分在4个象限中。市场占有率和销售额增长率均高于平均水平的产品,叫作明星类产品;市场占有率和销售额增长率均低于平均水平的产品,叫作瘦狗类产品;市场占有率低、销售额增长率高的产品叫作问题类产品;市场占有率高、销售额增长率低的产品叫作金牛类产品。
该模型运用在零售数据分析中,可以通过各个品类的销售额和售罄率对各品类进行定位。图1-45展示了对各个品类按照销售额和售罄率进行的四象限划分。处在右上方象限的是核心大品类,销售额高且售罄率保持良好,后期需保持品类宽度和深度的稳定;处在右下方象限的品类售罄率较高,但销售额偏低,后期需适度增加品类的宽度和深度,“做大”品类,提升销售额;处在左上方象限的品类售罄率相对偏低、销售额较高,后期在订货时需精选款色,适度压缩品类的宽度和深度;处在左下方象限的品类,销售额及售罄率均偏低,后期订货时需减少单款订量,精选款色、精选门店发放。
图1-45 品类销售额/售罄率综合分析
针对会员的新增及流失分析,也可以运用波士顿矩阵模型。图1-46展示了将各城市按照新会员数量占比和预流失会员数量占比划分的4个象限。会员管理较好的城市是处在右下方象限的城市,新会员占比相对偏高,预流失会员占比相对偏低;会员管理相对较差的城市是处在左上方象限的城市,新会员占比偏低,预流失会员占比偏高。
图1-46 各城市新会员及预流失会员综合分析
1.3.3 购物篮模型
购物篮模型是用来进行商品间关联性分析的经典模型。它通过研究客户的购买行为,找到同一个购物篮中出现频率相对较高的产品组合,从而挖掘出客户群体购买习惯中隐藏的共性和规律。运用这一规律,指导后期的业务策略,从而将这一规律主动性地放大,达到1+1 > 2的效果。比如经典的“啤酒+尿布”,以及超市中经常看到的“泡面+火腿肠”“贡丸+牛羊肉卷+火锅调料”等的组合陈列,均大大提升了购物篮的客单价及连带率。
购物篮模型通过3 个指标衡量产品间的关联程度,这3个指标分别为支持度、置信度、提升度。
支持度(Support),是指同时包含产品A 和产品B的单据数占总单据数的百分比。其计算公式为:支持度AB=单据数AB÷单据数Total×100%。支持度描述的是产品组合与整体的关系,反映了产品组合的重要程度。
例:在100 张单据中,买泡面的有40单,买火腿肠的有30单,同时包含泡面和火腿肠的单据有20单,则泡面和火腿肠组合的支持度是20÷100×100%=20%,即在所有单据中,同时包含泡面和火腿肠的单据占比为20%。
置信度(Confidence),是指包含产品A的单据中同时也包含产品B的百分比,即同时包含产品A和产品B的单据占包含产品A的单据的百分比。其计算公式为:置信度AB=单据数AB÷单据数A×100%。置信度描述的是个体与个体的关系,反映了产品关联规则的准确程度。
例:在100 张单据中,买泡面的有40单,买火腿肠的有30单,同时包含泡面和火腿肠的单据有20单,则泡面对火腿肠的置信度是20÷40×100%=50%,而火腿肠对泡面的置信度是20÷30×100%=66.7%。也就是说,在所有购买泡面的单据中,50%的单据中购买了火腿肠;而在所有购买火腿肠的单据中,66.7%的单据中购买了泡面。
提升度(Lift),是指包含产品A的单据中同时包含产品B的百分比与包含产品B的单据百分比的比值,即在购买产品A的情况下,购买产品B的概率是否大于只考虑购买产品B的概率,考查在产品A的影响下,产品B的购买率是否会有所提升。其计算公式为:提升度AB=(单据数AB÷单据数A)÷(单据数B÷单据数Total),或者提升度AB=置信度AB÷支持度B。
例:在100 张单据中,买泡面的有40单,买火腿肠的有30单,同时包含泡面和火腿肠的单据有20单,则泡面对火腿肠的置信度是20÷40×100%=50%,而火腿肠的支持度是30÷100×100%=30%。泡面对火腿肠的提升度是50%÷30%=1.67,即在购买泡面的影响下,购买火腿肠的概率比单独购买火腿肠的概率大,所以泡面和火腿肠是正相关性关系。
图1-47展示了女装各品类与女士防寒服的关联性分析,可以看到女士厚毛衫、女士内衣、打底裤这3 个品类相对女士防寒服的支持度和置信度都很高,具有较强的正相关性。女士牛仔裤相对女士防寒服的置信度是最高的,说明购买女士牛仔裤后买女士防寒服的概率最大,但是两者组合的支持度相对偏低,说明组合单据数相对偏少,其重要性程度弱于前3 个组合(女士厚毛衫、女士内衣、打底裤分别与女士防寒服的组合)。
图1-47 女装各品类与女士防寒服的关联性分析
1.3.4 转化漏斗模型
转化漏斗模型,本质上是对流程进行分解,从流程的起点到终点,量化每个步骤到下一个步骤的转化率,找到流程中对最终目标影响最大的关键节点进行改善,从而提升整个流程的转化率。
转化漏斗模型广泛应用在电商领域。某个购物网站,从进入首页→中间页→产品页,到加入购物车,进入支付页面,支付成功,再到复购,这里面的每个环节都存在一定程度的访客流失。通过转化漏斗模型找到转化率较低的几个环节进行优化。
转化漏斗模型也可以用于会员复购分析。从顾客进店注册成为会员,绝大部分顾客会在当日进行首次消费。如果购物体验良好,那么一段时间后顾客会进行复购。如果满意度一直保持在较高水平,那么顾客会不断地重复消费,成为忠实会员。另外还有一些顾客,在消费了一次或几次后,由于各种原因,不再来店消费,成为流失会员。转化漏斗模型就是分析从首次消费到二次消费、二次消费到三次消费……每增加一次消费,会员的转化及流失情况,找到针对会员转化的“发力点”。
图1-48展示了会员消费次数每增加一次,会员留存率的变化情况。可以看到随着消费次数的增加,留存率也在逐步增加,说明会员的忠诚度随着消费次数的增加在逐步提升。其中,从首次消费到二次消费,留存率最低,仅有58.21%。但从二次消费后继续增加消费次数,留存率基本处于一个较高水平,且逐渐趋于稳定,从65.1%逐渐增加到了83.53%。这说明该品牌会员转化的发力点在首次消费到二次消费这个节点。配合其他辅助手段,找到需要进行二次激活的会员及激活的最佳时点,最大限度地增加二次消费转化率,增加会员留存的基数,最终带来每个环节会员留存数量的增加。
图1-48 会员消费次数转化漏斗
1.3.5 AARRR模型
AARRR 模型是用于用户分析和管理的经典工具。它以完整的用户生命周期为线索,描述了用户使用产品需经历的5个环节。这5个环节从获取用户到用户最终为产品进行推广传播,形成一个使用户流量不断扩大的闭环商业飞轮,快速实现企业规模的扩展。AARRR 模型是转化漏斗模型的一个具体应用。
AARRR 模型分为用户获取(Acquisition)、用户激活(Activation)、用户留存(Retention)、用户变现(Revenue)和用户推荐(Referral)等5 个部分,如图1-49所示。
图1-49 AARRR模型
1.3.6 RFM模型
RFM 模型是衡量用户价值和创利能力的重要工具和手段。它通过研究用户的历史消费行为,包括用户最近一次消费距今时间、历史消费频率及历史消费金额3个指标,综合评定用户的价值。
● R(Recency):最近一次消费距今时间。R值越小,表示用户的活跃度越高。
● F(Frequency):历史消费频率。F值越大,表示用户的满意度越高。
● M(Monetary):历史消费金额。M值越大,表示用户的贡献值越高。
首先依据行业特征对R、F、M进行等级划分并确定各等级分值。表1-1展示了一个服饰企业的RFM 评分等级。分值越高,表示用户价值越大。其中,R-MIN表示R的最小值,R-MAX表示R的最大值,关于F与M的表头依此类推。
表1-1 RFM评分等级
然后,计算每个用户的R、F、M指标的实际数值,参照评分等级进行打分,并与所有用户的平均分进行比较,得到每个用户的RFM等级。根据这3个指标大于等于或小于均值,将所有用户分成8个组,如表1-2所示。
表1-2 RFM用户分组
最后,计算每组的会员数量占比及销售额占比,如图1-50所示。
图1-50 RFM各等级会员数量占比及销售额占比
从图1-50中可以看出,重要价值客户及重要价值流失预警客户的数量占比及销售额占比都相对较高,需进行重点维护或再次激活,他们是企业当前业绩的保证;频次深耕客户数量占比相对较高,销售额占比低于前两种客户,他们的活跃度及历史消费金额均较高,需吸引其不断进店消费,增加消费频率;高消费唤回客户的消费频率及活跃度相对较低,但客单价高,需重点唤回;新客户数量占比很高,但销售额占比很低,需重点跟踪并进行二次消费激活,他们是企业未来业绩持续增长的动力;流失客户数量占比相对较高,但销售额贡献很低,在资源有限的情况下可以放弃。
1.3.7 杜邦分析模型
杜邦分析模型是指利用几种主要的财务指标之间的关系来综合分析企业的财务状况的模型,是从财务角度评价企业经营绩效的经典模型。其基本思想是将核心的财务指标逐层拆解为一个个细分指标,便于从多个角度分析影响最终销售业绩的各项因素。
运用这一思想,我们可以将销售额进行拆解并对细分指标逐一分析,找到影响销售额的关键因素。图1-51展示了构成销售额的各项二级指标。
图1-51 构成销售额的二级指标
对销售额进行二级指标拆解后,参考各项二级指标同期或者上期的实际值,对各项二级指标进行预测,通过计算得到未来的销售目标,并制定相应的业务策略实现各项二级指标,最终实现既定销售目标。
图1-52展示了通过计算得到的最近30日的各项二级指标实际值。以实际值为基础,预测各项二级指标未来 N 天的数值,如果通过各二级指标预测值最终计算得到的销售额及销售完成率符合预期,则将预测值作为未来 N 天的目标,并制定相应的业务策略来实现各项二级指标,最终达成预期销售完成率目标。
图1-52 杜邦分析法拆解销售额并制定未来销售目标
1.3.8 销售预测模型
预测领域有很多成熟、经典的销售预测模型。此处介绍一种业务逻辑相对简单且能得到较为准确的预测结果的模型——历史同比法销售预测模型。该模型适用于零售行业销售数据呈现较为明显的周期性变化的应用场景。
模型以历史销售数据为基础,假设未来的销售数据会呈现和历史销售数据同期相似的变化规律。同时考虑到外界环境影响以及被预测个体自身的发展变化,引入同比增长率,该增长率反映内外因素对销售数据的综合影响。最后,考虑到单日销售数据会呈现一定的随机波动,对历史销售数据进行移动平均处理,对当日历史同期的前N 天的销售数据求平均值,将其作为当日同期销售数据,消除单日销售数据随机波动的影响,以便更加清晰地呈现出销售数据整体的变化趋势,从而预测未来的销售走势。
销售额的预测公式:预测销售额=同期销售额移动均值×(1+销售额同比增长率)。
图1-53展示了通过8月1日到8月20日的销售额,截至报表刷新日的销售额同比增长率,以及去年同期的日销售额,对8月剩余天数的日销售额及月度销售额进行的预测。
图1-53 月度销售额预测分析