降低风险与流失

通过数据驱动的洞察提升续保预测的准确性2_客户健康评分体系构建与预测模型开发

2026-04-27

本文系统阐述客户健康评分体系的构建方法、核心组成和评分细则,以及续保预测模型的开发流程和应用场景。深入讲解如何基于多维度数据构建科学、准确的健康评分体系,如何开发和应用机器学习预测模型,实现从经验判断到科学预测的转变。

一、客户健康评分体系的核心组成

1.1 健康评分的计算公式

客户健康评分是一个综合性的指标,用于评估客户当前的"健康"状态,反映客户续约的可能性。一个完整的健康评分体系通常采用加权评分的方法,将多个维度的评分综合成一个总分。

标准计算公式:

健康评分 = (产品使用权重 × 产品使用分) +

(客户情绪权重 × 客户情绪分) +

(采用深度权重 × 采用深度分) +

(价值实现权重 × 价值实现分) +

(客户关系权重 × 客户关系分)

权重设置原则:

权重设置应该根据企业自身的产品特点、客户群体和历史数据进行调整。以下是一些通用的原则:

行业差异:不同行业的客户,对健康评分的侧重点不同。例如,B2B企业软件可能更注重价值实现,B2C消费品可能更注重客户情绪。

客户细分:不同客户细分(如大客户vs小客户,新客户vs老客户)可以设置不同的权重。例如,新客户可能更注重产品使用,老客户可能更注重客户关系。

历史验证:权重设置应该基于历史数据进行验证和优化。可以通过分析历史续约数据,识别哪些维度对续约结果的影响最大。

持续优化:权重设置不是一成不变的,应该根据业务变化和数据积累持续优化。

权重示例:

评分维度示例权重说明
------------------------
产品使用维度30%反映客户对产品的参与程度和依赖程度
客户情绪维度25%反映客户对产品和服务的感受和满意度
采用深度维度20%反映客户对产品的使用深度和依赖程度
价值实现维度15%反映客户从产品中获得的实际价值
客户关系维度10%反映客户与企业之间的关系质量和紧密程度
总计100%

1.2 健康评分的动态调整机制

健康评分不应该是一个静态的指标,而应该是一个动态的、持续更新的指标。动态的健康评分体系可以更准确地反映客户当前的状态和变化趋势。

动态调整的四个机制:

机制1:趋势因子

趋势因子考虑评分的变化趋势,持续下降的客户应该获得更低的评分,因为趋势比当前值更能预测未来。

动态评分公式:

动态评分 = 当前评分 - (下降趋势 × 趋势权重)

其中:

如果过去3个月评分持续下降,下降趋势=1

如果过去3个月评分基本稳定,下降趋势=0

如果过去3个月评分持续上升,下降趋势=-1(即提升评分)

趋势权重设置:

趋势权重通常设置为5-10%,用于调整趋势对评分的影响程度。

机制2:近期变化权重

近期的数据应该获得更高的权重,因为它们更能反映客户当前的状态。远期的数据权重逐渐降低,但不会完全忽略,因为历史趋势仍然有参考价值。

时间衰减权重示例:

时间段权重
-------------
最近1个月40%
1-3个月30%
3-6个月20%
6-12个月10%

机制3:异常事件调整

重大负面事件(如关键干系人离职、严重投诉、主要竞争对手接触等)应该直接拉低评分,因为这些事件对续约决策有重大影响。

异常事件调整方法:

重大负面事件:直接减10-20分

中等负面事件:直接减5-10分

轻微负面事件:直接减2-5分

异常事件的影响通常持续3-6个月,之后逐渐衰减。

机制4:客户细分调整

不同客户细分的评分基准应该不同。例如,新客户的采用深度可能普遍较低,但这不代表他们的健康度低;大客户的关系要求可能更高,相同的关系状态,小客户可能更健康。

客户细分调整方法:

为每个客户细分设定基准评分和调整系数。

示例:

客户细分基准评分调整系数说明
---------------------------------
新客户(0-6个月)60分无调整新客户采用度低是正常的
成熟客户(6-24个月)75分无调整成熟客户应该达到较高的健康度
老客户(24个月以上)80分+5分老客户忠诚度高,适当加分
大客户(ARR>100万)70分-5分大客户要求更高,适当减分
小客户(ARR<10万)75分+5分小客户要求相对较低,适当加分

二、各维度评分细则

2.1 产品使用维度(示例权重:30%)

产品使用维度反映客户对产品的参与程度和依赖程度,是健康评分最重要的维度之一。

评分细则:

使用水平评分判断标准
------------------------
超出使用90-100核心功能使用率高,用户持续增长,超过许可数量
良好使用70-89主要功能使用良好,使用稳定,接近许可数量
一般使用50-69部分功能使用,但使用度不足,活跃用户数偏低
使用不足30-49登录频率低,功能使用有限,活跃用户数少
几乎不使用0-29几乎不使用或使用极低,登录频率极低

具体判断标准:

超出使用(90-100分):

周登录频率>4次

核心功能使用率>80%

活跃用户数>许可数量×80%

用户增长趋势>10%

良好使用(70-89分):

周登录频率2-4次

核心功能使用率60-80%

活跃用户数>许可数量×60%

用户增长趋势0-10%

一般使用(50-69分):

周登录频率1-2次

核心功能使用率40-60%

活跃用户数>许可数量×40%

用户增长趋势-10%到0

使用不足(30-49分):

周登录频率<1次

核心功能使用率<40%

活跃用户数<许可数量×40%

用户增长趋势<-10%

几乎不使用(0-29分):

几乎不登录或登录频率极低

核心功能使用率<20%

活跃用户数<许可数量×20%

用户持续流失

数据来源:

产品分析工具(Mixpanel、Amplitude等)

产品后端日志

客户成功平台

2.2 客户情绪维度(示例权重:25%)

客户情绪维度反映客户对产品和服务的感受和满意度,对续约决策有重要影响。

评分细则:

情绪水平评分判断标准
------------------------
非常积极90-100NPS>50,支持情绪积极,无负面反馈,主动推荐
积极70-89NPS 20-50,整体情绪正面,正面反馈多于负面
中性50-69NPS 0-19,情绪中性,正负面反馈相当
消极30-49NPS<0,存在负面反馈,投诉或抱怨较多
非常消极0-29NPS很低,多起投诉或严重负面事件,公开批评

具体判断标准:

非常积极(90-100分):

NPS>50

CSAT>9分

最近3个月无负面反馈

主动推荐产品给他人

积极(70-89分):

NPS 20-50

CSAT 7-9分

正面反馈多于负面

表示愿意推荐产品

中性(50-69分):

NPS 0-19

CSAT 5-7分

正负面反馈相当

对推荐产品没有明确表态

消极(30-49分):

NPS<0

CSAT 3-5分

负面反馈多于正面

存在投诉或抱怨

非常消极(0-29分):

NPS很低(如<-20)

CSAT<3分

多起投诉或严重负面事件

公开批评产品或服务

数据来源:

NPS/CSAT调查问卷

支持工单系统

AI情绪分析工具

客户反馈系统

2.3 采用深度维度(示例权重:20%)

采用深度维度反映客户对产品的使用深度和依赖程度,是评估客户"粘性"的重要指标。

评分细则:

采用水平评分判断标准
------------------------
全面采用90-100多部门采用,用户数占许可数的80%+,核心功能全面使用
深度采用70-89核心部门采用,用户数占许可数的60-79%,核心功能使用良好
中度采用50-69部分部门采用,用户数占许可数的40-59%,部分核心功能使用
浅度采用30-49少数用户采用,用户数占许可数的20-39%,核心功能使用有限
几乎未采用0-29极少用户使用,用户数占许可数的<20%,几乎未采用

具体判断标准:

全面采用(90-100分):

用户数占许可数>80%

多个部门使用(>3个部门)

核心功能使用率>70%

使用深度高(平均每个用户使用多个功能)

深度采用(70-89分):

用户数占许可数60-79%

核心部门使用(2-3个部门)

核心功能使用率50-70%

使用深度较好

中度采用(50-69分):

用户数占许可数40-59%

部分部门使用(1-2个部门)

核心功能使用率30-50%

使用深度一般

浅度采用(30-49分):

用户数占许可数20-39%

少数部门使用(1个部门)

核心功能使用率<30%

使用深度较低

几乎未采用(0-29分):

用户数占许可数<20%

仅单个部门或个人使用

核心功能使用率<10%

使用深度极低

数据来源:

客户成功平台

产品分析工具

CRM系统

客户调研

2.4 价值实现维度(示例权重:15%)

价值实现维度反映客户从产品中获得的实际价值和ROI,是续约决策的核心因素。

评分细则:

价值实现水平评分判断标准
--------------------------
超出价值90-100超额达成业务目标,ROI显著,价值超出预期
良好价值70-89达成主要业务目标,ROI良好,价值基本达到预期
基本价值50-69达成部分目标,ROI可接受,价值部分达到预期
价值有限30-49目标达成有限,ROI不明确,价值未达到预期
无价值0-29未达成任何目标,或ROI为负,价值严重未达预期

具体判断标准:

超出价值(90-100分):

超额达成100%以上的业务目标

ROI>200%

客户明确表示价值超出预期

主动扩容或推荐他人

良好价值(70-89分):

达成80-100%的业务目标

ROI 100-200%

客户对价值基本满意

认为物有所值

基本价值(50-69分):

达成50-80%的业务目标

ROI 50-100%

客户认为有价值但可以更好

对续约持谨慎态度

价值有限(30-49分):

达成20-50%的业务目标

ROI 0-50%

客户对价值不满意

对续约有较大顾虑

无价值(0-29分):

达成<20%的业务目标

ROI<0(负ROI)

客户认为没有价值

强烈考虑不再续约

数据来源:

客户成功计划

客户调研

ROI分析

客户反馈

2.5 客户关系维度(示例权重:10%)

客户关系维度反映客户与企业之间的关系质量和紧密程度,对续约决策有重要影响。

评分细则:

关系水平评分判断标准
------------------------
强关系90-100与关键干系人关系牢固,沟通频繁,高管支持,深度信任
良好关系70-89与主要干系人关系良好,定期沟通,基本信任
一般关系50-69有基本联系,但沟通不够深入,关系一般
关系薄弱30-49只与基层人员接触,缺乏高层对话,关系薄弱
无关系0-29几乎没有联系或联系中断,关系断裂

具体判断标准:

强关系(90-100分):

与C-Level高管有定期沟通(至少每月1次)

与关键干系人关系牢固

客户主动联系,深度参与

高度信任,愿意分享战略信息

良好关系(70-89分):

与VP/Director级别有定期沟通(至少每月1次)

与主要干系人关系良好

双向沟通较为平衡

基本信任

一般关系(50-69分):

与Manager级别有定期沟通(至少每月1次)

有基本联系,但不够深入

主要是单向沟通

关系一般

关系薄弱(30-49分):

只与基层员工有联系

缺乏高层对话

沟通频率低

关系薄弱

无关系(0-29分):

几乎没有联系

联系中断

关系断裂

无法获取客户信息

数据来源:

客户成功平台

CRM系统

日历系统

邮件系统

三、健康评分的风险分级

基于健康评分,可以将客户分为不同的风险等级,采取差异化的管理策略。

3.1 风险分级标准

风险等级健康评分范围颜色标识客户状态预期续约率
--------------------------------------------------
绿色(低风险)80-100分绿色健康度高>90%
黄色(中风险)60-79分黄色健康度中等70-90%
红色(高风险)0-59分红色健康度低<70%

3.2 差异化管理策略

绿色客户(低风险):

管理策略:

自动化续约流程

标准化续约提醒邮件

可选的QBR会议(不强制)

自动合同续订

低CSM介入频率

资源分配:

CSM介入时间:10-20小时/年

自动化覆盖率:>80%

续约预测准确率:>95%

黄色客户(中风险):

管理策略:

增加CSM触达频率(至少每月1次)

强制QBR会议(至少每季度1次)

价值确认演示

风险缓解计划

定期健康度检查

资源分配:

CSM介入时间:30-50小时/年

自动化覆盖率:50-80%

续约预测准确率:85-95%

红色客户(高风险):

管理策略:

高层管理者介入

深度价值分析

定制化续约方案

应急干预计划

专属支持资源

每周健康度检查

资源分配:

CSM介入时间:50-100小时/年

自动化覆盖率:<50%

续约预测准确率:70-85%

四、续保预测模型的开发

4.1 预测模型的类型

续保预测模型可以分为多种类型,从简单的规则模型到复杂的机器学习模型。

类型1:规则模型(Rule-Based Model)

特点:

基于业务规则和专家经验

易于理解和解释

实施成本低

但准确性和泛化能力有限

应用场景:

初步建立续保预测能力

数据量较小

需要快速实施

示例规则:

如果健康评分<60,预测为高风险

如果NPS<0,预测为高风险

如果核心功能使用率<30%,预测为高风险

类型2:回归模型(Regression Model)

特点:

基于统计学方法

预测续约概率(0-1之间的数值)

可以解释各因素的影响程度

准确性较高

应用场景:

有一定量的历史数据

需要预测续约概率

需要解释模型

常用算法:

逻辑回归(Logistic Regression)

线性回归(Linear Regression)

决策树(Decision Tree)

类型3:机器学习模型(Machine Learning Model)

特点:

基于机器学习算法

能够捕捉复杂的非线性关系

自动特征工程

准确性最高

但可解释性较差

应用场景:

有大量历史数据

需要高准确性预测

不强求可解释性

常用算法:

随机森林(Random Forest)

梯度提升树(Gradient Boosting,如XGBoost、LightGBM)

神经网络(Neural Networks)

类型4:深度学习模型(Deep Learning Model)

特点:

基于深度神经网络

能够处理大规模数据

自动特征学习

准确性极高

但需要大量数据和计算资源

可解释性最差

应用场景:

有海量数据

需要极高准确性

有充足的计算资源

常用架构:

深度神经网络(DNN)

循环神经网络(RNN)

Transformer

4.2 预测模型的开发流程

开发一个有效的续保预测模型需要遵循系统的开发流程。

阶段1:数据准备(1-3个月)

目标:收集、清洗和整合多源数据,为模型训练做好准备

步骤:

步骤1:数据收集

从CRM、计费系统、CS平台、产品分析工具等收集历史续约数据

收集时间跨度:至少12-24个月的历史数据

收集的客户数:至少100-200个客户

步骤2:数据清洗

处理缺失值:填补或删除缺失数据

处理异常值:识别和处理异常数据

数据标准化:统一数据格式和单位

数据去重:删除重复数据

步骤3:特征工程

创建特征:基于原始数据创建预测特征

特征选择:选择对预测最有用的特征

特征编码:将类别特征转换为数值特征

特征归一化:将特征缩放到统一范围

常见特征:

产品使用特征:登录频率、功能使用率、活跃用户数等

客户情绪特征:NPS、CSAT、支持工单情绪等

采用深度特征:用户数、活跃用户数、核心用户数等

价值实现特征:业务KPI达成率、ROI等

客户关系特征:关键干系人变动、沟通频率等

财务特征:付款及时性、扩容历史等

步骤4:数据划分

训练集(Training Set):70%的数据,用于训练模型

验证集(Validation Set):15%的数据,用于调参和验证

测试集(Test Set):15%的数据,用于最终评估

阶段2:模型开发(2-4个月)

目标:开发、训练和优化预测模型

步骤1:模型选择

根据数据量和业务需求选择合适的模型类型

初步尝试多种模型,对比效果

步骤2:模型训练

使用训练集训练模型

调整超参数,优化模型性能

步骤3:模型验证

使用验证集评估模型性能

调整模型参数,避免过拟合

步骤4:模型测试

使用测试集评估模型最终性能

计算关键评估指标

阶段3:模型评估(1-2个月)

目标:评估模型的性能和业务价值

评估指标:

准确性指标:

AUC-ROC:衡量模型区分续约客户和非续约客户的能力,范围0.5-1.0,越接近1.0越好

精确度(Precision):被预测为流失的客户中,实际流失的客户比例

召回率(Recall):实际流失的客户里,被模型准确预测出的比例

F1分数:精确度和召回率的调和平均值,综合反映模型性能

准确率(Accuracy):预测正确的比例

业务价值指标:

早期预警时间:提前识别到流失风险的时长

干预成功率:基于预警开展干预行动后,成功挽回客户的比例

预测vs实际偏差:预测续约金额和实际续约金额之间的偏差百分比

预测稳定性:在不同时间点进行预测,结果的一致性表现

评估方法:

对比分析:对比模型预测与实际结果

混淆矩阵:分析预测的准确性和误差类型

ROC曲线:绘制ROC曲线,计算AUC值

业务影响分析:评估模型对续约率和NRR的影响

阶段4:模型部署(1-2个月)

目标:将模型部署到生产环境,用于实际预测

部署方式:

批量预测:定期(如每周)批量预测所有客户的续约概率

实时预测:当客户数据更新时,实时预测续约概率

混合模式:关键客户实时预测,其他客户批量预测

部署内容:

模型API:提供模型预测的API接口

数据管道:建立数据抽取、转换、加载的管道

监控系统:监控模型预测的性能和准确性

告警系统:当模型性能下降时,自动告警

阶段5:模型维护(持续)

目标:持续监控和优化模型,保持模型的准确性和有效性

维护任务:

性能监控:定期监控模型的预测准确性和稳定性

模型重训练:定期(如每季度)用新数据重新训练模型

特征更新:根据业务变化更新特征

参数调优:根据数据变化调整模型参数


常见问题FAQ

Q1: 健康评分的权重如何设置?如何验证权重的合理性?

A: 健康评分的权重设置应该基于历史数据和业务需求进行。设置方法包括:

历史数据验证:分析历史续约数据,识别哪些维度与续约结果相关性最高。例如,通过逻辑回归分析,计算各维度对续约结果的影响系数,将系数归一化后作为权重。

A/B测试:尝试不同的权重设置,对比续约预测的准确性,选择最优权重组合。

专家评审:邀请客户成功团队、产品团队、销售团队等专家评审权重设置的合理性。

持续优化:权重设置不是一成不变的,应该根据业务变化和数据积累持续优化,建议每季度review一次。

验证权重的合理性可以通过以下方法:

相关性分析:计算各维度评分与续约结果的相关性

预测准确性测试:使用当前权重计算健康评分,评估预测续约的准确性

业务反馈:收集CSM和客户的反馈,了解健康评分是否符合实际情况

Q2: 健康评分应该多久更新一次?如何平衡实时性和准确性?

A: 健康评分的更新频率取决于数据更新的频率和业务需求。一般来说:

实时更新:对于关键指标(如产品使用数据、支持工单情绪),应该尽可能实时更新

每日更新:对于大部分指标,每日更新是一个很好的平衡点,既能及时反映客户状态变化,又不会给系统带来太大压力

每周更新:对于变化较慢的指标(如客户关系、价值实现),每周更新可以满足需求

平衡实时性和准确性的方法:

分层更新:不同维度采用不同的更新频率,核心维度实时更新,其他维度每日或每周更新

增量更新:只更新有变化的客户,而不是全部客户,减少计算负担

缓存机制:使用缓存机制,减少重复计算

批量计算:在业务低峰期进行批量计算,避免影响系统性能

一般来说,每日更新是一个很好的起点,可以根据实际情况调整。

Q3: 如何处理健康评分中的异常情况?如评分突然下降或上升?

A: 健康评分的异常情况可能是重大风险信号,也可能是数据问题,需要谨慎处理。处理方法包括:

步骤1:验证数据准确性

首先验证数据是否准确,排除数据错误的可能性:

检查数据采集是否有误

检查数据计算是否有误

检查是否有系统故障

步骤2:分析异常原因

如果数据准确,分析评分变化的原因:

检查各维度评分的变化,识别哪个维度导致评分变化

分析该维度下的具体指标变化

查找可能的事件(如关键干系人离职、严重投诉等)

步骤3:采取相应行动

根据异常原因采取相应行动:

如果评分突然下降:

立即通知CSM,深入调查

安排客户会议,了解情况

采取干预措施,防止进一步恶化

增加监控频率

如果评分突然上升:

分析上升原因,识别最佳实践

总结经验,推广到其他客户

验证上升是否可持续

步骤4:记录和分析

记录所有异常情况,定期分析:

建立异常事件库

分析异常原因的分布

识别常见模式和规律

优化异常处理流程

Q4: 预测模型的准确率一般能达到多少?如何提升模型的准确率?

A: 续保预测模型的准确率取决于多个因素,包括数据质量、数据量、模型选择、特征工程等。一般来说:

规则模型:准确率60-70%

回归模型:准确率70-80%

机器学习模型:准确率80-90%

深度学习模型:准确率90%+

提升模型准确率的方法:

提升数据质量:清洗数据,处理缺失值和异常值,确保数据准确和完整

增加数据量:收集更多的历史数据,数据量越大,模型性能越好

优化特征工程:创建更有预测力的特征,选择最相关的特征

尝试不同模型:尝试多种模型,选择性能最好的模型

调整超参数:通过网格搜索、随机搜索等方法优化模型超参数

集成学习:使用多个模型的集成(如随机森林、梯度提升树),提升性能

持续重训练:定期用新数据重训练模型,保持模型的时效性

领域知识结合:将业务领域知识结合到模型中,提升模型的合理性

需要注意的是,模型准确率的提升是有边际递减效应的,从70%提升到80%相对容易,从90%提升到95%可能需要付出很大的努力。应该在准确率、复杂度和成本之间找到平衡。

Q5: 如何评估预测模型的业务价值?ROI如何计算?

A: 评估预测模型的业务价值需要从多个维度进行,包括续约率提升、效率提升、成本降低等。

业务价值评估维度:

续约率提升:对比实施模型前后的续约率变化

例如:续约率从82%提升到88%,提升6个百分点

ARR为1亿,意味着每年增加600万收入

流失率降低:对比实施模型前后的客户流失率

例如:客户流失率从18%降低到12%,降低6个百分点

假设平均客户价值为10万,挽留60个客户,每年增加600万收入

CSM效率提升:对比实施模型前后CSM的人均管理客户数

例如:CSM人均管理客户数从20提升到30,提升50%

CS M团队规模不变,可以服务更多客户,降低单位客户成本

早期预警时间:模型提前识别到流失风险的时间

例如:平均提前2个月识别风险,有充足时间干预

挽回成功率从30%提升到60%,挽回更多客户

ROI计算:

ROI = (收益 - 成本) / 成本 × 100%

收益计算:

续约率提升带来的收入增长

流失率降低带来的挽回价值

CSM效率提升带来的成本节约

其他业务价值(如客户满意度提升)

成本计算:

模型开发成本:人力、时间、工具等

模型部署成本:基础设施、运维等

模型维护成本:持续优化、重训练等

ROI示例:

假设:

ARR为1亿

续约率从82%提升到88%,增加600万收入

CSM效率提升50%,节约人力成本200万/年

模型开发和部署成本:300万

年度维护成本:50万

收益 = 600万(收入增长) + 200万(成本节约) = 800万/年

成本 = 300万(一次性) + 50万/年(维护) = 350万(第一年)

ROI = (800 - 350) / 350 × 100% = 129%

从第二年开始,ROI = (800 - 50) / 50 × 100% = 1500%

一般来说,续保预测模型的ROI很高,投资回收周期通常在6-12个月。

Q6: 预测模型的可解释性如何处理?如何让CSM理解模型的预测?

A: 预测模型的可解释性是一个重要挑战,特别是对于复杂的机器学习模型和深度学习模型。处理方法包括:

选择可解释的模型:如果业务需要较强的可解释性,优先选择逻辑回归、决策树等可解释性较强的模型,而不是黑箱模型(如神经网络)

使用特征重要性分析:分析模型中各特征的重要性,解释哪些因素对预测影响最大。例如,随机森林和XGBoost可以输出特征重要性排序

使用局部可解释性方法:使用LIME、SHAP等局部可解释性方法,解释单个客户的预测结果,识别影响该客户预测的关键因素

提供预测解释:为CSM提供预测结果的解释,例如:

"客户A的流失风险高,因为:1)健康评分从85下降到55;2)NPS从40下降到-10;3)核心功能使用率从80%下降到40%"

培训和沟通:对CSM进行培训,解释模型的原理和局限性,建立信任和理解

建立反馈机制:建立CSM反馈机制,收集他们对模型预测的反馈,用于优化模型和改进解释

提供决策支持:不仅仅提供预测结果,还要提供决策支持和行动建议,帮助CSM理解如何应用预测结果

需要注意的是,准确性和可解释性之间存在权衡。如果业务需要极高的准确性,可能需要牺牲一定的可解释性。应该在准确性、可解释性和业务需求之间找到平衡。

相关推荐

立即咨询
获取专属方案报价