客户净推荐值(NPS)影响因素的驱动力分析

接2016年8月6日博文《客户净推荐值(NPS)预测建模》。基于识别出的影响NPS值波动的关键驱动因素,我们建立了NPS预测模型。此时,另一个经常被问的问题是:在这些驱动因素中,哪些对NPS影响更大、哪些要小一些,即驱动力的相对大小如何?这是一个典型的驱动力分析或动因分析(Driver analysis)问题。本文即聚焦于此,引入Shapley值分解法给予解答。两篇博文概述了我们在项目中相关分析的完整框架和流程,供分享和讨论。

目录

  • 基本分析思路
  • 步骤1:构建路径结构模型
  • 步骤2:拟合路径系数(即驱动力的相对强弱分析)
  • 总结:补充说明
  • 后记:相关阅读

基本分析思路

在NPS预测建模分析过程中,我们识别出若干测试题目构成预测变量集,将它们引入模型可以确保有较高准确度对个体在NPS三类客户类型中归属做出预测。因此,这些变量即是影响NPS值波动的关键驱动因素。

在此基础上,我们仍然想要探究:在这些驱动因素中,哪些对NPS影响更大、哪些要小一些,即驱动力的相对大小如何?显然,这是一个典型的驱动力分析(Driver analysis)问题。

通常,驱动力分析尝试去数量化潜在驱动因素(有时称为自变量/指标/属性等)与目标变量(有时称为因变量)在取值上的联系紧密程度,作为相对驱动力大小的度量。譬如,对手机某方面特性的体验感知(1-5’评价)与整体推荐意愿(0-10’评价)的相关程度。

 

Fig1. 什么是驱动力分析?

与通常的分析逻辑不同,作为NPS预测建模的延伸分析,我们这里的驱动力分析以某一驱动因素(即预测变量集中某个变量)对NPS预测模型的优良性(即预测准确度或正判率)的提升效果作为其对NPS驱动力强弱的度量。

可用于进行驱动力分析的方法非常之多,从简单的计数算法和相关分析、到复杂的结构方程模型和贝叶斯信念网络等,繁杂不一,均有各自的适用场景。考虑到分析结果的易于理解性,以及我们数据集的自身性质(如前陈述,变量个数多且混合有各种测量尺度),这里开展驱动力分析的基本思路是:构建路径分析模型,并以Shapley value法(以下简称SV法)进行推断。

1

步骤1:构建路径分析模型

路径模型(Path modeling)常被用于揭示若干影响因素对目标变量(在本次项目中为NPS)的“分层级”的作用机制,层级结构既认可某些驱动因素彼此之间存在联系、又认为驱动因素作用于目标变量的模式存在逻辑性(而非同一性)。尤其,当驱动因素个数较多时,路径模型用于驱动力分析更受欢迎,层级结构有助于简单化问题本身,引导从业人员更聚焦地解决问题。

路径模型的结构往往依赖于研究人员对事物的理解予以构建,发展一个符合直觉、易与理解、与业务发展模式匹配度高的结构总是受到推崇。[注:此处略去最终推荐的路径模型]

在本次分析中,我们认为由NPS预测建模识别出的所有关键驱动因素(即预测变量)可被归纳为描述手机用户的四个维度,这些维度既包括用户自身的客观状态、也涉及他们对品牌和产品的主观态度、以及外部环境的影响。具体地,作为第一层级影响NPS的四个维度是:

– 背景信息(过往使用经历):用户自身的客观状态

– 体验感知与期望的匹配程度:与用户对品牌价值的感知、对手机产品本身的使用体验相关

– 口碑感知:可理解为与社交相关的外部环境对用户的影响

– 售后体验:有可能发生的特定行为,可理解为潜在风险因素

 

步骤2:拟合路径系数(即驱动力的相对强弱分析)

一个典型的路径模型,譬如在很多场合使用的结构方程模型(SEM),常被用于拟合路径系数的统计方法是偏最小二乘回归(Partial Least Square regression)。此时,一般要求自变量和因变量应具有相同的测量尺度,且具有类连续变量的属性。

在本次分析中,作为驱动因素的变量个数多且为混合测量尺度,而且它们的驱动力强弱以对NPS预测模型的优良性的提升效果为度量。因此,我们应用SV法对路径系数进行推断。

SV法解决合作博弈中的收益分配问题,通过测度一个个体对联盟(即总体)的边际贡献来衡量其对联盟的重要程度。有关SV法原理等介绍,可查阅博弈论领域的教科书或其它著作,以及互联网上信息搜索。

Fig2. Lloyd S. Shapley荣获2012年诺贝尔经济学奖

SV法经常用于产品测试、客户满意度等市场调研中,某一属性/指标的边际贡献在数值上等于:在各种可能的组合下,包含该属性/指标与不包含该属性/指标时度量值(本项目为NPS预测的正判率)的平均差异大小。

SV值的具体算法如下:

3

 Fig3. Shapley value算法

在本次分析中,我们对所推荐的路径模型逐层使用SV法推断路径系数,具体执行步骤为:

1) 计算第一层级四个维度对NPS驱动的路径系数

对于由四个维度构成的变量集(即联盟)中,所有可能的组合数=2^4-1=15。相应地,运行这样的15次判别分析(是预测建模中采纳的基础分类算法)过程,记录每一次的正判率,然后按照上面公式即可计算得到四个维度分别的SV值,经折算为加总100%之后为:

– 背景信息(过往使用经历):16.9%

– 体验感知与期望的匹配程度:49.3%

– 口碑感知:23.2%

– 售后体验:10.6%

[注]:SV法度量个体对联盟的“边际贡献”,可视为“净效应”,因此可折算为加总100%(隐含前提是当前变量集被视为是影响NPS的完备集合)。

2) 计算第二层级[背景信息(过往使用经历)]内变量的路径系数

其实,相当于将[背景信息(过往使用经历)]对NPS的驱动力16.9%在维度内进行再分配。维度内包含3个变量,所有可能的组合数=2^3-1=7。其它分析操作同1)。

3) 计算第二层级[体验感知与期望的匹配程度]内变量的路径系数

4) 计算第三层级[体验感知与期望的匹配程度]内变量的路径系数

这里稍有变化,我们认为产品的具体属性体验感知是其它任何整体感知的影响因素。此外,所有可能的组合数=2^13-1=8191,这是一个庞大的量—— 一个广泛被接受的近似做法是,仅考虑少数几阶的组合,譬如1-2阶,有人在极高性能计算系统内测试过计算精度可接受。这里,我们考虑了5阶组合,所有可能的组合数=2379,这仍然需要耗费数小时去运行。

[注]:此处略去路径模型的完整的路径系数显示。

 

总结:补充说明

路径模型是解决复杂的驱动力分析问题的一个解决方案,应用广泛,但研究人员应首先确保模型结构符合业界的通常认知,避免随意性。

当分析涉及的变量个数多且为混合测量尺度,以回归或偏回归建模(譬如通常的路径模型)为基础的统计分析方法往往不适用,此时宜转而借助其它方法,源自博弈论领域的SV法有时是一个好的替代。

SV法考虑变量集(即联盟)中所有可能的组合,当变量个数较多时,计算量非常大、非常耗时,需谨慎选用。

 

 

 

作者:Kevin Gao

转载自领英

 

DataTALKS(数易创研)是专业的市场研究与数据采集机构

数易创研  | 策略型专项市场研究

数据说™   | 敏捷调研服务+自助调研平台

有礼科技  | 移动端在线样本平台

%e8%8e%b7%e5%8f%96%e6%95%b0%e6%8d%ae%e8%af%b4%e7%ae%80%e4%bb%8b%7c%e4%ba%a7%e5%93%81%e6%89%8b%e5%86%8c%7c%e6%a1%88%e4%be%8b%7c%e4%bc%98%e6%83%a0_%e4%ba%8c%e7%bb%b4%e7%a0%81

扫描或识别二维码

获取数易创研服务简介 | 案例 | 报价

 

via 领英