作者:kylequ  腾讯PCG数据分析工程师

|导语  指标体系是什么?GSM、OSM、HEART、AARRR、场景化(人物场)等指标模型如何搭建指标体系? 本文将以大盘dau、留存、业务渗透、时长等指标,从维度建模,指标建设规范出发来搭建星型模型,构建完备指标体系。并且介绍如何基于MECE来拆解wau,通过指数移动平均(EMA)分解dau时间序列查看dau趋势。

1

指标体系定义

指标体系是将零散单点的具有相互联系的指标,系统化的组织起来,通过单点看全局,通过全局解决单点的问题。它主要由指标和体系两部分组成。

指标是指将业务单元细分后量化的度量值,它使得业务目标可描述、可度量、可拆解,它是业务和数据的结合,是统计的基础,也是量化效果的重要依据。

体系是由不同的维度组成,而维度是指用户观察、思考与表述某事物的“思维角度”,维度是指标体系的核心,没有维度,单纯说指标是没有任何意义的。

2

指标模型

2.1、AARRR模型

又称为海盗模型,分为五大类:获取用户(Acquisition)、提高活跃(Activation)、提高留存率(Retention)、获取营收(Revenue)和自传播(Referral),简称AARRR。每个环节都有这个环节应该关注的指标,这些环节并不一定遵循严格的先后顺序。

2.2、HEART模型

HEART模型是由Google推出用来衡量用户体验设计成果的模型,主要用来评估用户体验,一般在产品初期使用较多

2.3、OSM模型

OSM模型(Obejective,Strategy,Measurement)是指标体系建设过程中辅助确定核心的重要方法,包含业务目标、业务策略、业务度量,是指标内容横向的思考

2.4、场景化模型

比较流行的一种通用抽象场景“人、货、场”,实际就是我们日常所说的用户、产品、场景,通俗点讲就是谁在什么场景下使用了什么产品,不同的商业模式会有不同的组合模式。如下是一个经典的电商‘人货场’的指标体系,其实也可以抽象为浏览器免费小说,分别对应用户、渠道、书籍。

3

指标体系搭建

3.1、指标确定

3.2、表建设

表名、字段名采用一个下划线分隔词根(示例:useraction->user_action)

每部分使用小写英文单词,属于通用字段的必须满足通用字段信息的定义

表名、字段名最长不超过64个英文字符

优先使用词根中已有关键字(wiki词根管理),定期Review新增命名的不合理性

3.3、数仓分层

3.4、建立模型

3.5、指标体系

4

指标拆解

4.1MAU拆解

如下图所示,大盘mau在12月中旬开始大幅下降,dau相对稳定。下述曲线并不能很好的反应用户的流失状况,mau下降如何解释?

MAU(t) = new(t) + retained(t) + resurrected(t)

MAU(t - 1) = retained(t) + churned(t)

第一个公式描述的是今天及之前的30天的活跃用户是由今天的新用户、昨天月活留存用户和月沉默用户回流构成,需要注意的是,这是一种对mau的MECE的分类方式。

第二个公式描述的是昨天的月活跃用户等于今天的留存用户加昨天的流失用户将以上两个公式做一下处理,得到以下公式:

MAU(t) - MAU(t - 1 ) = new(t) + resurrected(t) - churned(t)

该公式描述的是MAU的增长是由今天的新用户加今天的回流用户,减去昨天流失用户得到的。

基于此,我们定义一个比率指标是(新用户+月沉默用户回流)/流失用户,这个比率指标如果大于1,mau就能实现增长,否则流失的用户数就会覆盖掉增长的用户数,我们称之为“速动比率”(quick ratio)。

根据新增、回流、流失、速动,我们绘制mau的MAU Growth Accounting

基于趋势图,我们可以发现,月速动比率从 12月12日起持续低于1,使得MAU快速下降。月流失在增加,月回流和新增都在减少。可以初步从拉新拉活方面去查看相关的策略变化。

4.2、DAU时间序列

有两种技术可以获取时间序列要素。在进行深入研究和查看相关Python抽取函数之前,必须了解以下两点:

- 时间序列不必具有所有要素。
- 弄清该时间序列是可加的还是可乘的。

可加性模型–在可加性模型中,要素之间是累加的关系。

y(t)=季节+趋势+周期+噪音

可乘性模型–在可乘性模型中,要素之间是相乘的关系。

y(t)=季节*趋势*周期*噪音

- g(t):趋势函数,趋势拟合时间序列中非周期性变化,判断序列处于上升或下降趋势;
- s(t):周期性变化,周期性包括每周、月、季节等变化趋势;
- h(t):变点,潜在的具有非固定周期的节假日及变点对预测值造成的影响;
- ϵ(t):噪声项,表示未预测到的随机波动。

通过上面的拆解就可以把指标的变化波动归结为下面的几个图

在“指数移动平均”(EMA)中,随着观察值的增加,权重将按指数递减。该方法通常是一种出色的平滑技术,可以从数据中消除很多噪声,从而获得更好的预测。

import numpy as np

import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.api import ExponentialSmoothing

EMA_fit = ExponentialSmoothing(elecequip, seasonal_periods=12, trend='add', seasonal='add').fit(use_boxcox=True)
fcast3 = EMA_fit.forecast(12)

ax = elecequip.plot(figsize=(10,6), marker='o', color='black', title="Forecasts from Exponential Smoothing" )
ax.set_ylabel("Electrical Equipment")
ax.set_xlabel("Index")

For plotting fitted values

EMA_fit.fittedvalues.plot(ax=ax, style='--', color='red')

EMA_fit.forecast(12).rename('EMS Forecast').plot(ax=ax, style='--',
marker='o', color='blue', legend=True)

下图就是经过EMA处理的时间序列,可以通过实际值-趋势值-周期值得到对应的噪音。

4.3、指标体系产品化

近期热文

【To B管理端】图表设计指南

云计算是技术驱动的商业模式

【前端技术】react渲染 - 流程概述

让我知道你在看

文章来源于腾讯云开发者社区,点击查看原文