导语 |生命周期是一款产品“生老病死”的过程,在这个大的过程之中,又嵌套叠加了无数用户从新增、留存、活跃、到沉默的小过程。对这些过程的分析和理解,能让我们对产品和用户有更深入的,更数量化的认知,进而辅助到日常的运营工作中。本文总结了几点对生命周期分析工作的思考,包括一些数据处理的技巧,主要环节的分析和价值点的挖掘等。

本文作者:cooperyjli,腾讯CSIG应用运维组

如果把一款产品比作是一艘邮轮,那么这款产品在应用市场上架的时刻,可以当做是这艘邮轮航程的起点。在这趟航程里,会有无数的乘客(用户)先后来到和离开这艘邮轮。当这艘邮轮最后一次停泊靠港时,也就是其生命周期已抵达了终点,准备在应用市场下架了。

本文首先厘清了关于生命周期的基本概念,明确了需要发力的方向,进而介绍了几个数据处理的技巧,处理后的数据相对会更友好。并对生命周期的主要环节(新增/留存/活跃/沉默)逐一展开观察和分析,最后分享了几个在生命周期分析里可以挖掘的价值点。

注:本文所涉及的数据都已做了脱敏处理和量纲转换。

1. 基本概念

1.1 生命周期

周期这个概念,可以很玄妙,也可以很具体。往大的层面讲,可以从太阳黑子的活动规律讲起,进而深入到人类社会的康波周期,人口周期,可以说万物皆周期,万物都处在周期的运行过程之中。往小的层面讲,一款产品,产品里的用户,都有一个(或几个)生命周期。

生命周期是一个从开始到消亡的过程,起点和终点都是确定的,不确定的则是这个过程所持续的时间,所变化的形式。生命周期分析所要做的,便是理解这个过程,优化这个过程。

1.2 产品和用户的生命周期

产品生命周期:每一款产品在投入市场后,大体上都会经历探索期,成长期,成熟期和衰退期这四个阶段。探索期最重要的是学习,学习到底哪些是目标用户,为了与这些用户互相适应,要如何优化这款产品;到了成长期时,已对用户有了一定的理解,此时很关键的一点是“拉人头”,先把有效的用户圈起来,后面一切好说;成熟期往往是一款产品价值爆发的阶段,活跃用户的氛围,增值付费的能力,都会达到峰值;不可避免的,成熟期过去后,每一款产品都会迎来衰退期,只是有些产品一次衰退就挂了,另一些则进入到第二个周期里。

用户生命周期:与产品生命周期相对应的,这款产品里的每一个用户也都有自己的生命周期。只是在应用市场里,用户的数量往往要远超于产品的数量,所以用户的生命周期也就呈现出更为丰富,更为多元的形态,有些用户注册后“一言不合”就走了,有些则一直留了下来。

总体上来讲,用户会经历新增,留存,活跃,沉默,流失这几个过程,只是这几个过程并不一定连贯,可以交叉穿越,比如从新增直接流失,这是“薅羊毛”的用户,比较常见于互金,理财类的产品;比如从留存直接流失,其中有一部分是在不同竞品间进行比较,当比较完成之后,便也直接流失了。而那些真正完整经历了每个过程,并在每个过程的核心指标里表现优异的用户,便是我们需要关注的头部用户,他们往往会贡献出这款产品里最大的价值。

1.3 生命周期分析的意义

通过对产品生命周期的分析,可以更好地打磨每个环节的转化情况,让产品和用户不断地相互适应,从早期的粗放式经营转化为一种更为精耕细作的方式。在用户成长体系的每一个关卡,进行引导和助力,量变会带来微小的质变。

2. 数据处理

常见的数据处理方法,有移动平均,相关分析,数据变换等几种数据处理的方式。真实业务下的数据,往往都是带有噪音的,偶尔会有一些“坑坑洼洼”。如果直接去看最终数据的话,往往是很不友好的,通过一些数据处理的技巧,能让我们更便捷地观察业务数据的变化情况,并猜想和验证这些数据变化背后的深层次原因。

2.1 去平均化

设置统计指标的初心,是为了能把握整体业务的变化情况,平均数,中位数等的制定,都是为了观察业务数据的集中和离散趋势。在很多的场景下,这些指标都是有效的,但并不代表它们可以适用于所有场景,当场景不合适时,只看这些指标反而会形成干扰。尤其是在用户体量很大,数据分布具有严重的“左偏”或者“右偏”时,只看平均值可能就不合适了。

去平均化,或者说是用户分组,便是应对这种情况的一种处理方式。其实就是在整体平均值发生变化时,通过对用户进行分组,观察用户内部的结构变化,可能会得到不一样的结论。整体平均值的增长,是否对应每一个用户组的增长?不同组是否会有不一样的变化趋势?

图2.1.1 不同用户分组的留存趋势

当整体业务在以某种趋势变化时,不要用户分组的变化可能不是协同的。方向一致时,彼此的变化速度不一样,可能会在某个时间点形成交叉,并且之后又以不同的速度反向翻转。通过去平均化的方式,可以更好地理解用户内部的结构差异。

通过什么方式对用户进行分组更为合理?这个问题类似于在做机器学习的特征时,如何对连续属性的字段进行分箱,虽然分箱方法有很多,但等频和等距仍然是其中经典而常用的两种方式。应用到用户分组这里,等频就是按照数据量来分割,等距就是按照属性值来分割。

2.2 留存矩阵

在生命周期分析的工作中,会有很多的场景都会涉及留存的统计,比如注册之后的留存,活跃之后的留存等,同时因为时间的推移,不同时期用户的留存情况可以形成一个留存矩阵。这个矩阵的设计,可以有不同的方式,能表达出所关注的用户群的留存趋势变化即可。

先分析得出不同形式的留存矩阵。得到留存矩阵后,从不同的视角出发,可以做不同角度的观察和分析。在每一个月份新增的用户群体,可以得到其在三个月/六个月/九个月之后留存比例的趋势变化情况。

图2.2.3 不同距离月的留存趋势变化

2.3 因子分析

对生命周期的分析过程中,不可避免地会要做一些因子分析,比如在具体环节下,对某项具体的指标(留存率,活跃频次,未来是否付费),是否存在一些较为有效的因子,能与其具备良好的相关性。因子分析的结果,虽然不如深度的模型结果来的精准,但处理过程却相当简洁,在不同场景下总能找到一些有效的因子,是一种性价比相对良好的统计方式。

针对不同的产品,从不同的关注点出发,可以搭建起最适合自己的因子体系。其实不需要像金融市场的101因子等做得那么全面而深入,选择一些自己最关心的,同时与核心指标相关的一些因子,就可以做出一个有效的因子体系。此后有需求时,直接从中取数即可。

图2.3.1 因子体系的结构

2.4 一阶差分

做机器学习的特征选择时,有时会应用到一阶差分,通过观察其收敛的转折区域,从而筛选出更为有效的特征。这个方法也可以用在生命周期的场景里,因为这个场景涉及大量的长尾分布,由于头部和尾部的用户量级差异较大,所以其内部的变化速度很难直接观测出来。尾部用户虽然量级较小,但往往是对产品贡献最大的那群人,所以其内部变化是值得关注的。

如图2所示,即是一个经典的长尾分布,但在这个分布里面,越是尾部的用户,越是我们需要关注的高活跃用户。通过图3,可以看出在这个长尾分布里面,不同区域的用户数量变化速度,头部和尾部的变化速度都是较大的,中部区域的用户变化则相对平稳。

图2.4.1 某个长尾分布

图2.4.2 某长尾分布的一阶差分

3. 生命周期主要环节

3.1 新增

如果把注册用户当做一个半封闭的系统的话,那么每月新增用户就是这个系统唯一的外界能量输入。新增用户的持续输入,会影响原有的用户池的结构,与此同时,新增用户本身在不同时期也可能出现不同的特征。所以,对新增用户的观察,就是一件有意义的事情。

新增用户简况:对新增用户的观察,首先是每月新增用户数的观察,这个指标可以细分到地区和市场,从而了解每月新增用户在绝对量上的变化趋势;同时可以观察当月新增用户对原有用户池的影响,这里就涉及累积用户数和环比增速这两个指标,用于评估用户池的变化。

新增用户质量:在对新增用户的数量有了一定了解后,可以对其“质量”进行评估,从中可以观察到来自不同时期,不同渠道的用户差异。如何评估新增用户的质量,可以基于所分析的产品的侧重点去思考,比如活跃,留存,或者互动的情况。新增用户的质量变化,虽然会有阶段性的波动,但大体上还是会在时间里呈现出一个明确的趋势,只是趋势变化程度不同。

新增用户因子分析:到了新增用户因子分析,就已经切换了视角,不再关心产品角度,或者不同时间段的用户群角度,而更多是从微观的视角出发,通过对用户的状态、行为等因子分析,从而分析出一些有价值的业务点。通过用户在首周,首月里的活跃天数,活跃次数,具体产品功能的使用情况,找到其后期行为表现的依据。这些行为规律往往更具有稳定性。

图3.1.1 用户增长与环比增速

图3.1.2 新增用户在距离1个月的留存率变化趋势

3.2 留存

当用户通过注册进入到产品用户池时,此后的结局只有两种,沉默和活跃,只是根据沉默和活跃的程度不同,又可以细分出更多的用户群体。对于留存用户的观察,可以更清晰地看到其内部不同用户群体的结构变化,从而对不同群体采用不同策略进行管理。

整体留存简况:对留存简况的评估,可以通过用户注册总量了解用户规模,同时可以选定一个时间周期(比如每月),通过对该周期内留存用户的不同表现,从而了解其内部的结构差异,比如每月不同活跃天数的用户数量变化趋势,或者分组之后不同组的变化趋势等。

留存寿命:基于固定时间周期,和基于固定流失条件,都可以对用户留存寿命进行观察和分析。基于固定时间周期,比如注册后500日内,观察用户的留存寿命差异;基于固定流失条件,比如沉默30天后,认为已经流失,该次生命周期已经结束,此后再激活时,则当做是新一轮生命周期的开始。基于这种角度,也可以对用户的留存寿命差异进行统计。

留存行为模式:从产品的角度出发,可以观察不同时间段进入的用户的留存行为模式,有趣的是,有些产品从投入市场后,每月新增用户的留存曲线,会逐渐地收敛,最后稳定到一个固定的趋势曲线上;从用户的角度出发,则可以梳理出一些典型的留存行为模式,他们的生命周期长度不同,从激活到抵达活跃峰值的速度不同,此后从衰减到沉默的过程也不同。

图3.2.1 产品不同时期的用户留存趋势-A

图3.2.2 产品不同时期的用户留存趋势-B

图3.2.3 留存用户分组后的结构变化

3.3 活跃

活跃和付费,往往是一款产品价值间接和直接的兑现过程,所以也是产品分析中的一个重点。日常运营过程中,很多监测指标其实都可以归类到这两个范畴。

整体活跃简况:相对于新增和留存阶段,活跃阶段需要关注的指标相对多一些,活跃人数用来观察用户规模,活跃频次用来观察用户氛围,活跃时长则可以表达这场party的可持续性。这些指标看似相似,描述同一个内容,但在发生变化时,有一个明显的传导关系。

整体付费简况:付费数据的处理,相对要复杂一些,涉及到付费渠道,付费金额的单位,以及不同币种之间的汇率结算。同时因为一些自动续费的付费场景,付费数据在短期的时间趋势上可能并不好看,波动程度较大。但一些常规的统计指标还是适用的,比如每日付费人数,每日付费总额,人均付费金额,次均付费金额,以及不同产品下的付费占比等。

核心指标分组观察:以活跃指标为例子,对核心指标的分组,即按照一定的方法,将用户群分为不同的组别单独观察。笔者在试验过程中,采用等距切分的方式,对活跃的UV、PV、Time分为了五个组别。当整体活跃指标发生变化时,可以观察到不同组别渐次变化的现象。

活跃因子分析:在活跃的场景下,可以挖掘的活跃因子是比较多的,比如VIP对活跃的影响,购买VIP前后,用户的行为变化特征,以及VIP本身对活跃指标的影响;比如活跃时长和活跃频次之间的相关关系,两者并非完全相关,存在着不同相关形式的用户群,对这些用户群的挖掘是有意义的。活跃因子分析中,可以侧重于对时间节点的把握,比如购买之前几天用户会开始访问VIP商城,购买之后多长时间,对活跃的影响开始有了减弱。

图3.3.1 活跃核心指标观察

图3.3.2 活跃时长和活跃频次的相关关系

图3.3.3 活跃人数分组观察

3.4 沉默

在已注册的用户池中,有很大一部分用户是处于沉默状态的,这是大部分产品都要面对的问题,尤其是工具类型的产品。当用户的沉默达到了一定时长时,可以近似认为其已经流失。

整体沉默简况:整体的沉默简况,可以将每天作为一个时间粒度,通过统计用户上次活跃距今时长,统计当前不同程度的沉默用户,从而盘点出一个整体的沉默简况。

沉默程度细化:沉默和回流往往是相对应的,沉默的程度越低,回流的概率越大,沉默的程度越高,回流的程度则越小,这两者的负相关性是确定的,但在不同阶段的变化却有很大的差异。对于不同的产品,其回流率的变化曲线也是不同的,可以对此进行细分统计分析。

沉默因子分析:对于沉默因子的挖掘,可能最后仍然会回到一些核心指标的变化上来。也就是说,如果用户在未来会陷入沉默,逐渐走向流失,那么在此之前可以较为明显地观察到其核心行为指标的变化。沉默因子分析的结果,可以用于流失前的预警,流失后的干预等场景。

图3.4.1 不同沉默时长的用户群变化趋势

4. 价值点挖掘

生命周期的分析,除了对产品/用户的周期过程有更清晰的认知和理解外,还应在数据之中挖掘出一些价值点,用于制定实际的业务运营策略。它们围绕着生命周期的主要环节,可以是复杂的模型输出,也可以是一些简单的统计Tips,用于实现对目标用户群的精细化运营。

4.1 新增用户首月行为

新增用户的首月行为模式,在较大程度上已经可以预示其之后的行为模式,这种现象类似于《圣经》里说的“七岁见大”。比如首月活跃天数,看似是一个简单的指标,但以此进行分组的话,不同组别在此后的行为表现是迥异的,界限清晰的,是一个用户分组的良好指标。

如图4.1.1所示,从整体来看,这四个分组在此后的行为表现是界限分明的。虽然高活跃组和低活跃组在第一个月结束时,曲线出现了一个缺口,但对整体趋势的影响并不是很大。也就是说,当运营资源有限时,可以往首月行为较好的用户群倾斜,可能会有更好的效果。

图4.1.1 根据首月活跃天数分组后的长期留存趋势

4.2 注册用户环比增速

随着注册用户规模的基本盘变大,每月新增用户的数量逐渐平缓或者走低时,虽然偶有波动,但从长期来看,注册用户环比增速的降低是必然的。只是环比增速在不同档位时,其实也是产品处于不同的发展阶段,高增长,稳增长,或者已经趋近于饱和阶段。通过对整体的或者不同地区细分的环比增速的观察,可以相对应地改变不同运营策略的权重值。

图4.2.1 不同时期的注册用户环比增速

4.3 用户行为基本模式

通过产品角度去观察用户行为的基本模式,可以看出不同时间阶段下用户的行为变化,比如从投入市场后,此后不同时期的留存率曲线会逐渐收敛到一个稳定的水平;通过微观的用户角度,则可以用活跃周期长短,活跃峰值高低等,去梳理和总结出具体产品下一些基本的行为模式,针对行为模式的差异,也可以对不同类型的用户进行分群和运营。

4.4 核心指标分组观察

当产品在发生变化时,核心指标本身的变化是具有传导性的,比如活跃时长的影响最早,最深,进而先后传导到活跃频次,活跃人数的变化上来。而对核心指标的分组观察,则是进一步地进行细分,观察在这个指标变化的过程中,不同用户群体先后产生的不同程度的变化。

图4.4.1 核心指标分组观察

5. 总结

1. 基本概念:本文首先厘清了关于生命周期的几个基本概念,每一款产品,每一个用户,都具有自己的一个或者几个生命周期。其中用户的生命周期具有新增,留存,活跃,沉默等基本环节,但并非每一个用户都会经历完整的生命周期,基本环节之间是可以交叉穿越的。

2. 数据处理:生命周期分析中涉及一些数据处理的工作,除了此前介绍的移动平均,相关系数之外,本文接着介绍了去平均化,留存矩阵,因子分析,一阶差分等数据处理和分析方法。

3. 基本环节:基于产品和用户的角度,对生命周期的新增,留存,活跃和沉默这四个基本环节逐一做了梳理,提出了一些可以思考和分析的点,以及分析过程中碰到的有意思的现象。但许多内容只是一个大体的思路,并没有细致地展开去讲,可以在实践过程中深入去做。

4. 价值点:生命周期的分析,除了对其过程需要有清晰的认知和理解外,还应该从数据中挖掘出一些有价值的点,并应用到实际的业务场景之中。文中分享了新增用户首月行为,注册用户环比增速,用户行为基本模式,核心指标分组观察这四个点,但这些肯定是远远不够的,更多是起到一个抛砖引玉的作用,提供给读者作为一个参考。


# 腾讯技术直播 #

腾讯工程师分享技术干货:

扫码预约,get开播提醒

往期回顾:

大型项目研发经验分享:以3A游戏为例

        存量时代,不能错过的新方向:客户成功

   用户流失预警分析

再谈项目经理的核心价值

点个关注,我们下期再见👋

文章来源于腾讯云开发者社区,点击查看原文