当环比数据 “失控”:五大妙法还原商户增长真相
做数据分析时,有时候会碰到一些难以解释的异常情况,比如文章中这种环比异常增长的案例,如何找到真相?本文分享的五个方法,希望可以帮到大家。 一、问题现状 做商户交易分析的时候,经常会碰到一种让人头疼的情况。比如说,上个月有些商户的生意不咋地,交易额只有个位数,可能就几块钱。但这个月突然就火了,交易额一下子变成了好几百甚至好几千。这一对比,环比增长率就大得离谱,完全不能正常反应商户的真实经营变化。要是就这么直接看数据,很容易被误导。 那怎么才能把这些数据处理得合理点,还能清楚地知道哪些商户环比增长或者减少得多呢?下面就给大家讲讲几个实用的办法。 二、计算方式优化 2.1、设定合理阈值 可以根据业务经验和数据特点设定一个合理的环比增长率阈值,比如超过 1000% 或 2000% 等视为异常值。对于超过阈值的数据,单独进行标记或分组处理,在展示和分析时区别对待,既不影响整体的排序和分析,又能关注到这些特殊情况。 例如,在上述商户交易数据统计业务中,根据以往数据波动情况,发现一般商户的环比增长率很少超过 1000%,那么就可以将 1000% 设为阈值。 假设我们正在分析某商户的环比增长数据,原始数据如下: 根据以往该商城商户数据波动情况,发现一般商户的环比增长率很少超过 1000%,所以将 1000% 设为阈值。对于超过阈值的商户 A、商户 C 和商户 E 进行单独标记或分组处理。 整体分析:在不考虑这些异常值的情况下,对剩余商户(如商户 B、商户 D、商户 F)进行分析,可得到一般商户的平均环比增长率、增长趋势等数据,以此了解商城内大多数商户的正常业务增长情况。例如,这些正常增长商户的平均环比增长率为 18.3%,说明在正常情况下,大部分商户保持着较为稳定的增长。 异常值分析:单独查看超过阈值的商户 A、商户 C 和商户 E。商户 A 可能是因为上月参加了一个效果不佳的促销活动,导致基数较低,而本月恢复正常经营且有新的爆款商品推出,使得销售额大幅增长;商户 C 或许是获得了一笔大额订单,属于偶然因素导致的增长;商户 E 可能是成功入驻了某热门平台的推荐位,从而销量暴增。通过对这些异常值的单独分析,可以挖掘出背后特殊的业务事件或机遇,为其他商户提供借鉴,或者为平台制定针对性的扶持政策提供依据。 2.2、采用对数转换 对数据进行对数转换,将原始的环比数据取对数后再进行分析和排序。这样可以压缩数据的范围,使极大值和极小值之间的差距相对缩小,减少异常值对整体排序的影响,同时也能在一定程度上反映数据的相对变化趋势。 例如,原本环比增长率为 10000% 的数据,取对数后会变成一个相对较小的值,与其他数据的差距不再那么悬殊,能更合理地参与倒序排列。 假设我们正在分析某电商平台上 5 家商户的季度环比增长率数据,原始数据如下: 通常我们使用以 10 为底的对数进行转换(当然也可以根据实际情况选择自然对数等)。对上述环比增长率数据进行以 10 为底的对数转换。 原始数据排序:按照原始环比增长率从高到低排序为:商户 A(10000%)、商户 B(500%)、商户 C(200%)、商户 D(50%)、商户 E(10%)。可以看到商户 A 的环比增长率数值远高于其他商户,在排序中占据绝对优势,这种过大的差距可能会掩盖其他商户之间相对变化的信息。 对数转换后排序:按照对数转换后的值从高到低排序为:商户 A(4)、商户 B(2.7)、商户 C(2.3)、商户 D(1.7)、商户 E(1)。通过对数转换,极大值(商户 A)与其他值之间的差距被明显压缩,使得各商户之间的相对差异更加合理地呈现出来。这样在分析排序时,我们能更全面地考虑到所有商户的相对变化情况,而不会过度受极端值(如商户 A 的超高环比增长率)的影响。对数转换后的数据能确保资源分配不仅仅倾向于增长幅度极为突出的个别商户,而是综合考虑到各类增长程度的商户,促进平台整体的均衡发展。 2.3、计算移动平均环比 计算移动平均环比,即不仅考虑当前周期与上一周期的环比,还综合考虑多个周期的环比情况,取其平均值。这样可以平滑数据,减少单个周期异常值的影响,更能体现商户的长期趋势和稳定增长情况。 例如,计算过去 3 个周期的移动平均环比,用本周期与前三个周期分别计算环比,再求平均值,作为该商户的综合环比指标进行排序。 2.4、分区间统计和展示 将数据按照一定的金额区间或环比增长区间进行分组统计和展示。对于那些前一周期金额较小、本周期金额大幅增长的商户,单独放在一个区间进行分析和展示,与其他正常增长的商户区分开来,这样可以更清晰地看到不同区间内商户的环比增减情况。 例如,将商户分为 “个位数金额增长到六位数金额”,“十位数金额增长到五位数金额” 等不同区间,分别分析每个区间内的环比增减情况和排名。 假设我们收集了某电商平台在一个特定时间段内,1000 家商户的上一周期和本周期交易金额数据,以下是基于区间统计和展示的具体分析: 1)设定区间 区间一:个位数金额增长到六位数金额 区间二:十位数金额增长到五位数金额 区间三:百位数金额增长到四位数金额 区间四:正常增长区间(上下波动幅度在 ±50% 以内) 2)数据归类与统计 经过对 1000 家商户数据的整理,各区间商户分布如下: 区间一:有 10 家商户属于个位数金额增长到六位数金额。上一周期这些商户平均交易金额为 5 元,本周期平均达到了 150000 元。 区间二:共 25 家商户是从十位数金额增长到五位数金额。上一周期平均交易金额为 85 元,本周期平均为 18000 元。 区间三:40 家商户符合百位数金额增长到四位数金额。上一周期平均交易金额为 650 元,本周期平均为 4500 元。 区间四:剩下的 925 家商户处于正常增长区间。上一周期平均交易金额为 5000 元,本周期平均为 5500 元。 3)环比增减情况分析 区间一:环比增长率极高,平均环比增长率达到了约 3000000%。这些商户可能是一些新兴的特色小商家,抓住了某个热门趋势或平台推广机会,实现了爆发式增长。 区间二:平均环比增长率约为 21000%。这类商户可能是在原有基础上通过优化产品或服务,吸引了更多客户,实现了较大幅度的增长。 区间三:平均环比增长率约为 592%。这些商户稳步拓展业务,可能通过一些常规的营销手段或改进经营策略,取得了较为可观的增长。 区间四:平均环比增长率为 10%。该区间内商户增长较为平稳,代表了平台上大多数商户的常规增长水平。 排名展示 对于每个区间内的商户,按照环比增长率进行排名。例如在区间一中,商户 A 上一周期交易金额为 3 元,本周期达到了 180000 元,环比增长率高达 6000000%,在该区间内排名第一。这表明商户 A 在这类爆发式增长的商户中,增长速度最为突出。 2.5、采用相对比率指标 除了环比增长率,还可以引入其他相对比率指标,如定基比率等,从不同角度衡量商户的增长情况。结合多个指标进行综合评估,避免仅依赖环比数据导致的异常值影响过大问题。 例如,以某个固定周期为基期,计算每个周期与基期的定基比率,再结合环比数据,综合判断商户的增长趋势和幅度。 假设我们有某商户连续 5 个季度的交易数据,如下表所示: 1)计算环比增长率 环比增长率 = (本期数 – 上期数)/ 上期数 ×100% Q2 环比增长率 = ($12000 – 10000) / 10000×100% = 20% Q3 环比增长率 = ($15000 – 12000) / 12000×100% = 25% Q4 环比增长率 = ($13000 – 15000) / 15000×100% ≈ -13.33% Q5 环比增长率 = ($18000 – 13000) / 13000×100% ≈ 38.46% 2)计算定基比率 以 Q1 为基期,定基比率 = (各期数 / 基期数)×100% Q2 定基比率 = ($12000 / 10000)×100% = 120% Q3 定基比率 = ($15000 / 10000)×100% = 150% Q4 定基比率 = ($13000 / 10000)×100% = 130% Q5 定基比率 = ($18000 / 10000)×100% = 180% 3)综合分析 从环比增长率看,Q2 到 Q3 增长态势良好,但 Q4 出现了负增长,Q5 又大幅增长。环比数据能体现相邻两个周期的变化情况,但如果某一周期数据异常(如 Q4 因特殊原因导致交易金额下降),可能会影响对整体趋势的判断。 而定基比率始终以 Q1 为参照,更能体现从基期开始的总体增长趋势。该商户从 Q1 到 Q5 的定基比率持续上升,表明整体上交易金额处于增长状态。 通过结合环比增长率和定基比率这两个相对比率指标,我们可以更全面、准确地评估该商户的增长情况。例如,在分析 Q4 数据时,虽然环比出现负增长,但结合定基比率发现,相较于基期 Q1 仍有 30% 的增长,说明该商户的业务总体增长趋势未变,Q4 的下滑可能是短期波动,而非长期趋势逆转。 通过以上一种或多种方法的结合使用,可以更合理地处理数据,既能有效应对环比率异常大的情况,又能准确地看出环比增减大的商户,为数据分析和决策提供更有价值的信息。 本文由 @一个帽子的世界 原创发布于人人都是产品经理。未经作者许可,禁止转载 题图来自 Pexels,基于CC0协议 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
做数据分析时,有时候会碰到一些难以解释的异常情况,比如文章中这种环比异常增长的案例,如何找到真相?本文分享的五个方法,希望可以帮到大家。
一、问题现状
做商户交易分析的时候,经常会碰到一种让人头疼的情况。比如说,上个月有些商户的生意不咋地,交易额只有个位数,可能就几块钱。但这个月突然就火了,交易额一下子变成了好几百甚至好几千。这一对比,环比增长率就大得离谱,完全不能正常反应商户的真实经营变化。要是就这么直接看数据,很容易被误导。
那怎么才能把这些数据处理得合理点,还能清楚地知道哪些商户环比增长或者减少得多呢?下面就给大家讲讲几个实用的办法。
二、计算方式优化
2.1、设定合理阈值
可以根据业务经验和数据特点设定一个合理的环比增长率阈值,比如超过 1000% 或 2000% 等视为异常值。对于超过阈值的数据,单独进行标记或分组处理,在展示和分析时区别对待,既不影响整体的排序和分析,又能关注到这些特殊情况。
例如,在上述商户交易数据统计业务中,根据以往数据波动情况,发现一般商户的环比增长率很少超过 1000%,那么就可以将 1000% 设为阈值。
假设我们正在分析某商户的环比增长数据,原始数据如下:
根据以往该商城商户数据波动情况,发现一般商户的环比增长率很少超过 1000%,所以将 1000% 设为阈值。对于超过阈值的商户 A、商户 C 和商户 E 进行单独标记或分组处理。
整体分析:在不考虑这些异常值的情况下,对剩余商户(如商户 B、商户 D、商户 F)进行分析,可得到一般商户的平均环比增长率、增长趋势等数据,以此了解商城内大多数商户的正常业务增长情况。例如,这些正常增长商户的平均环比增长率为 18.3%,说明在正常情况下,大部分商户保持着较为稳定的增长。
异常值分析:单独查看超过阈值的商户 A、商户 C 和商户 E。商户 A 可能是因为上月参加了一个效果不佳的促销活动,导致基数较低,而本月恢复正常经营且有新的爆款商品推出,使得销售额大幅增长;商户 C 或许是获得了一笔大额订单,属于偶然因素导致的增长;商户 E 可能是成功入驻了某热门平台的推荐位,从而销量暴增。通过对这些异常值的单独分析,可以挖掘出背后特殊的业务事件或机遇,为其他商户提供借鉴,或者为平台制定针对性的扶持政策提供依据。
2.2、采用对数转换
对数据进行对数转换,将原始的环比数据取对数后再进行分析和排序。这样可以压缩数据的范围,使极大值和极小值之间的差距相对缩小,减少异常值对整体排序的影响,同时也能在一定程度上反映数据的相对变化趋势。
例如,原本环比增长率为 10000% 的数据,取对数后会变成一个相对较小的值,与其他数据的差距不再那么悬殊,能更合理地参与倒序排列。
假设我们正在分析某电商平台上 5 家商户的季度环比增长率数据,原始数据如下:
通常我们使用以 10 为底的对数进行转换(当然也可以根据实际情况选择自然对数等)。对上述环比增长率数据进行以 10 为底的对数转换。
原始数据排序:按照原始环比增长率从高到低排序为:商户 A(10000%)、商户 B(500%)、商户 C(200%)、商户 D(50%)、商户 E(10%)。可以看到商户 A 的环比增长率数值远高于其他商户,在排序中占据绝对优势,这种过大的差距可能会掩盖其他商户之间相对变化的信息。
对数转换后排序:按照对数转换后的值从高到低排序为:商户 A(4)、商户 B(2.7)、商户 C(2.3)、商户 D(1.7)、商户 E(1)。通过对数转换,极大值(商户 A)与其他值之间的差距被明显压缩,使得各商户之间的相对差异更加合理地呈现出来。这样在分析排序时,我们能更全面地考虑到所有商户的相对变化情况,而不会过度受极端值(如商户 A 的超高环比增长率)的影响。对数转换后的数据能确保资源分配不仅仅倾向于增长幅度极为突出的个别商户,而是综合考虑到各类增长程度的商户,促进平台整体的均衡发展。
2.3、计算移动平均环比
计算移动平均环比,即不仅考虑当前周期与上一周期的环比,还综合考虑多个周期的环比情况,取其平均值。这样可以平滑数据,减少单个周期异常值的影响,更能体现商户的长期趋势和稳定增长情况。
例如,计算过去 3 个周期的移动平均环比,用本周期与前三个周期分别计算环比,再求平均值,作为该商户的综合环比指标进行排序。
2.4、分区间统计和展示
将数据按照一定的金额区间或环比增长区间进行分组统计和展示。对于那些前一周期金额较小、本周期金额大幅增长的商户,单独放在一个区间进行分析和展示,与其他正常增长的商户区分开来,这样可以更清晰地看到不同区间内商户的环比增减情况。
例如,将商户分为 “个位数金额增长到六位数金额”,“十位数金额增长到五位数金额” 等不同区间,分别分析每个区间内的环比增减情况和排名。
假设我们收集了某电商平台在一个特定时间段内,1000 家商户的上一周期和本周期交易金额数据,以下是基于区间统计和展示的具体分析:
1)设定区间
区间一:个位数金额增长到六位数金额
区间二:十位数金额增长到五位数金额
区间三:百位数金额增长到四位数金额
区间四:正常增长区间(上下波动幅度在 ±50% 以内)
2)数据归类与统计
经过对 1000 家商户数据的整理,各区间商户分布如下:
区间一:有 10 家商户属于个位数金额增长到六位数金额。上一周期这些商户平均交易金额为 5 元,本周期平均达到了 150000 元。
区间二:共 25 家商户是从十位数金额增长到五位数金额。上一周期平均交易金额为 85 元,本周期平均为 18000 元。
区间三:40 家商户符合百位数金额增长到四位数金额。上一周期平均交易金额为 650 元,本周期平均为 4500 元。
区间四:剩下的 925 家商户处于正常增长区间。上一周期平均交易金额为 5000 元,本周期平均为 5500 元。
3)环比增减情况分析
区间一:环比增长率极高,平均环比增长率达到了约 3000000%。这些商户可能是一些新兴的特色小商家,抓住了某个热门趋势或平台推广机会,实现了爆发式增长。
区间二:平均环比增长率约为 21000%。这类商户可能是在原有基础上通过优化产品或服务,吸引了更多客户,实现了较大幅度的增长。
区间三:平均环比增长率约为 592%。这些商户稳步拓展业务,可能通过一些常规的营销手段或改进经营策略,取得了较为可观的增长。
区间四:平均环比增长率为 10%。该区间内商户增长较为平稳,代表了平台上大多数商户的常规增长水平。
排名展示
对于每个区间内的商户,按照环比增长率进行排名。例如在区间一中,商户 A 上一周期交易金额为 3 元,本周期达到了 180000 元,环比增长率高达 6000000%,在该区间内排名第一。这表明商户 A 在这类爆发式增长的商户中,增长速度最为突出。
2.5、采用相对比率指标
除了环比增长率,还可以引入其他相对比率指标,如定基比率等,从不同角度衡量商户的增长情况。结合多个指标进行综合评估,避免仅依赖环比数据导致的异常值影响过大问题。
例如,以某个固定周期为基期,计算每个周期与基期的定基比率,再结合环比数据,综合判断商户的增长趋势和幅度。
假设我们有某商户连续 5 个季度的交易数据,如下表所示:
1)计算环比增长率
- 环比增长率 = (本期数 – 上期数)/ 上期数 ×100%
- Q2 环比增长率 = ($12000 – 10000) / 10000×100% = 20%
- Q3 环比增长率 = ($15000 – 12000) / 12000×100% = 25%
- Q4 环比增长率 = ($13000 – 15000) / 15000×100% ≈ -13.33%
- Q5 环比增长率 = ($18000 – 13000) / 13000×100% ≈ 38.46%
2)计算定基比率
- 以 Q1 为基期,定基比率 = (各期数 / 基期数)×100%
- Q2 定基比率 = ($12000 / 10000)×100% = 120%
- Q3 定基比率 = ($15000 / 10000)×100% = 150%
- Q4 定基比率 = ($13000 / 10000)×100% = 130%
- Q5 定基比率 = ($18000 / 10000)×100% = 180%
3)综合分析
- 从环比增长率看,Q2 到 Q3 增长态势良好,但 Q4 出现了负增长,Q5 又大幅增长。环比数据能体现相邻两个周期的变化情况,但如果某一周期数据异常(如 Q4 因特殊原因导致交易金额下降),可能会影响对整体趋势的判断。
- 而定基比率始终以 Q1 为参照,更能体现从基期开始的总体增长趋势。该商户从 Q1 到 Q5 的定基比率持续上升,表明整体上交易金额处于增长状态。
- 通过结合环比增长率和定基比率这两个相对比率指标,我们可以更全面、准确地评估该商户的增长情况。例如,在分析 Q4 数据时,虽然环比出现负增长,但结合定基比率发现,相较于基期 Q1 仍有 30% 的增长,说明该商户的业务总体增长趋势未变,Q4 的下滑可能是短期波动,而非长期趋势逆转。
通过以上一种或多种方法的结合使用,可以更合理地处理数据,既能有效应对环比率异常大的情况,又能准确地看出环比增减大的商户,为数据分析和决策提供更有价值的信息。
本文由 @一个帽子的世界 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自 Pexels,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
你的反应是什么?