快手用户增长 LTV 模型及其应用

快手用户增长 LTV 模型及其应用在传统的经济学、市场学当中,LTV经常会被应用的场景是:在一个超市中去分析来这个超市的人的整体的LTV,即LTV=Average Value o

大家好,欢迎来到IT知识分享网。

导读:本文将分享LTV 模型在用户增长上的应用和搭建,主要介绍:

  • 什么是 LTV?
  • LTV 可以解决什么问题?
  • 什么时候需要什么样的 LTV 预估?
  • 如何实现设备粒度的LTV 预估?
  • LTV 如何应用?如何撬动更大的价值?

01

什么是LTV

快手用户增长 LTV 模型及其应用

在传统的经济学、市场学当中,LTV经常会被应用的场景是:在一个超市中去分析来这个超市的人的整体的LTV,即LTV=Average Value of Sale *Number of Transactions * Retention Time Period,然后再做一个宏观的数据统计和预测。

在互联网的应用环境下,通常把LTV拆解为两项:一个是LT(Life Time),一个是 ARPU(Average Revenue Per User)。通常在用户生命周期的概念规范下,LT(Life Time)代表用户在生命周期内的活跃天数;ARPU(Average Revenue Per User)是指用户每次活跃时产生的价值;即LTV=LT(Life Time)*ARPU(Average Revenue Per User)。

02

LTV可以解决什么问题?

1. 用户增长中的生命周期

快手用户增长 LTV 模型及其应用

用户增长中的生命周期分为以下五个阶段

第一个阶段是潜在用户阶段,即用户还没有成为你站内的用户;第二个阶段,用户成为你的站内用户,是一个新增用户;第三个阶段新增用户可能会活跃,就会成为一个活跃用户,一个活跃用户有可能继续活跃,也有可能流失:第四个阶段,当用户流失掉的时候,就是一个已流失的用户;第五个阶段,流失用户形成一个用户增长池,可以再去拉回用户来提升整体的DAU。

2. LTV应用于增长的生命周期管理

快手用户增长 LTV 模型及其应用

LTV 模型可应用于增长的生命周期管理的五个阶段。

(1)对于潜在用户,可以通过一些站外的数据或者一些媒体侧的增长的数据,去预估潜在的用户或者潜在的设备的LTV价值的高低;此时使用的粒度比较粗,例如地域、男女等粗粒度的画像特征。

(2)对于新增用户,可以去构建其画像特征和行为特征等,来预估用户在本次生命周期内的 LT 和ARUP。

(3)对于活跃用户,数据充足,体量大,可根据近 N 天的各种特征等去预测用户在本次生命周期内的LT和ARPU;活跃用户的数据可以做到一个日粒度的更新,对应的LTV价值预估可经常刷新。

(4)当活跃用户流失之后,进入到流失用户池,需要预估用户的潜在回流LTV价值,筛选出潜在回流LTV价值高的用户。

(5)对于回流用户,其LTV价值的分析跟新增用户比较类似,即根据该用户在本次回流的前 N 天的各种特征等去预测该用户在本次生命周期的 LT 和ARPU。

3. 增长策略在生命周期的应用

快手用户增长 LTV 模型及其应用

LTV预测在增长策略中如何应用?还是从生命周期的五个阶段依次拆解。

第一个阶段是潜在用户阶段,如果知道潜在用户的LTV价值,在买量时,就可以进行相应的调价:高价值的用户出高价,低价值用户出低价;从而可实现ROI优化的目标。

第二个阶段是新增用户阶段,当用户来到站内之后,可根据其前几天的表现去调整其对应的LTV价值预估,可以用于复盘该新增用户的增长策略做得好不好,也就是说当用户来到站内以后,经过一些时间行为的积累,预估其在本次生命周期的LTV价值,去衡量这次买量的效果好不好。比如说你花了5块钱买了一个用户,通过该用户前几天的一些表现,预估该用户在本次生命周期能够产生比如10块钱的收益,那么这次买量就是成功的、划算的。

第三个阶段是活跃用户阶段,可以每天刷新活跃用户在本次生命周期的LTV价值,但此时也需要去关注和衡量一个用户的长期价值。在用户增长策略和方法中,经常会发push拉活。比如用户因为发push来到站内,那短期内对DAU有增长,但同时预估其长期的价值,可以知道这一次的促活能带来的长期价值是什么;这就衍生了白盒化分析的一些应用,后面会有涉及。

第四个阶段是流失用户阶段,首先在用户流失之前,如果一直刷新活跃用户的LTV价值预测,识别出LTV价值的下降趋势,可以进行流失预警;对于已流失的用户,可以根据其潜在的LTV价值高低,然后拉回,和拉新的逻辑比较像,即在拉回策略上的一个优化。

第五个阶段是对于回流用户的LTV预估,和新增用户的LTV预估比较类似,就是根据拉回用户的前几天的站内表现,去回顾看一下这一次把这个用户买回来,或者说是用一些策略吸引回来的,效率如何。

03

什么时候需要什么样的LTV预估

到底需不需要一个LTV预估?在什么场景下要怎么样进行LTV预估?如何决策,和公司的发展策略、业务具体的应用场景都是息息相关的,有很强的逻辑性,我们从以下四个维度进行分析。

快手用户增长 LTV 模型及其应用

第一个维度是颗粒度,即需要对哪个颗粒度进行LTV价值预估。

颗粒度,首先包括大盘,是今天活跃的所有设备,还是整体存量用户库;然后包括某一个cohort,一个cohort是指特定编码的用户群或设备群,比如今天的新增设备可以是一个cohort,或者今天新增从某一个渠道买来的一批用户也是一个cohort,可以对某一个cohort进行LTV价值预估;最后包括设备/用户,是LTV价值预估的终极模态。如果能够差异化地预估每一个设备的LTV,应用场景就非常的广泛,可以把LTV价值预估聚合到任何维度,但是如果颗粒度越细的话,建模难度、误差等就会越高;颗粒度太粗又无法满足业务需求,因此一定要结合具体的业务应用场景,去决定一个合适的颗粒度。

第二个维度是时效性,是指每一次做出预估的时候需要等待一个什么样的周期才能预估出来本次生命周期的LTV,比如预估一年内的LTV,等的时间越久,其实就越接近真实值,但要是等得太久的话,那业务不如再等两天看真实值就算了,所以这里存在取舍,对于时效性要求越快的话,预估肯定是越不稳以及越不准,但是越慢的的话,业务又不能满足需求;因此还是需要要结合业务的应用场景去决定时效性。

第三个维度是准确性。

为什么准确性是一个决定维度?比如LTV预估一个全量的值,如果真实值是100,要估100才对,估98、95都不对,这样的标准太严格,因此在准确性上需要有一定的取舍。尤其是在做设备粒度的LTV预估时,有一些模型的效果是序会更准,比如A、B两个设备,预估出来A设备比B设备的价值要高,但具体的准确数值,可能估得不一定准;有一些模型的估值更准,比如聚合在某一个cohort上,这个估值的min会比较小,但序就不太准了。更深入来分析,则可能需要在一个数据分布和建模选择上进行取舍,当然需要结合具体业务需求去分析,如果评估实验组和参照组的差值,那序准更重要,可以获取设备之间谁大谁小的关系;如果是渠道买量等,就需要获取某cohort、应用或者设备的LTV价值,比如花了5块钱买量,最终是不是产生了10块钱还是15块钱收益,那需要预估的LTV价值准;要根据应用场景的不同做一定的取舍。

最后一个维度是用户生命周期定义。

在传统的市场学中,用户生命周期是指用户的寿命周期,就是完完整整的生命周期,buy until you die。但是在我们的业务应用场景中,用户生命周期会定义一个数字,有可能是一个月、一年,也有可能十年;具体是多长时间会通过以下几个因素进行分析决定。

(1)公司的发展阶段

如果公司发展到了比较成熟且稳定的阶段,则要关注用户的长期价值;如果在飞快发展的阶段,历史值都不太具有参考性,建模的稳定性以及对于未来的预估的能力也不足;因此要根据公司发展阶段来决定生命周期的长短。

(2)宏观经济地域环境

当去预估一个设备或者一个渠道的价值时,如果看的比较长久一些,要考虑设备多久换一次机,和换机时间是否能够匹配上,其实也是buy until you die的逻辑,这个时候捕捉的就是设备的生命长度;具体需要看多长时间的周期就要根据宏观的经济环境去决策。

(3)历史数据积累

和第一点类似,不赘述。

(4)应用场景

在某些应用场景下是否需要和某些指标对齐,那么也会影响用户生命周期定义。

快手用户增长 LTV 模型及其应用

下面介绍几个常规的LTV预估模型。

第一个模型是历史值拟合。

针对某一个cohort或大盘,根据整个cohort或大盘的真实留存数据,去拟合一个曲线y=a*ln(x)+b,预估出a和b的值,从而可以预估后续日期的LTV价值。

该模型的好处是应用比较简单,简单清晰。弊端是稳定性差,比如有一些激励政策或前七天有促活,拟合出来的曲线就会有偏差,不是一个符合真实情况的成立函数;也有可能中间有一些活动带来的一些尖刺spike,就会直接带偏未来的预测,需要等的时间比较久,通常等30天、60天都有可能,预测才能真的稳定下来。

第二个模型是Probabilistic Model。

该模型将LTV拆解为LT和ARPU,当去看某个cohort或者大盘时,假设这些指标都是某种分布,然后根据历史数据预估该分布的参数,从而来预估未来的LTV,通常用于看大盘比较多。

快手用户增长 LTV 模型及其应用

最后一个模型是通过DNN或Machine Learning建模去构建特征,包括用户近N天画像特征、行为特征、消费特征、生产特征等,所有和业务、产品相关的维度,对用户本次生命周期的LT和ARPU分别进行预估。

下面从常理上剖析一下该模型。通过此类模型预估的LT和ARPU,实际上都面临一个问题:大部分的用户可能活跃一天或者花 10 块钱就走了,有一部分用户就花特别多的钱,但可能在尾部又出现一个spike,即20%的用户贡献80%的收入,这样的分布建模的难度比较高,比如用平常的MAE当loss的话,就不太容易能够把这些极端的情况都捕捉到,可能会受比较奇怪的分布的影响,没有办法学到稀疏的地方。Google预估LTV的一个方法是没有拆LT和ARPU,采用zero inflated log normal 模型直接预估一个用户的LTV,具体可参考这篇文章:

《Wang, X., Liu, T., and Miao,J. (2019), A deep probabil- istic model for customer lifetime value prediction, Available from: https://arxiv.org/abs/1912.07753》

快手电商与增长模型团队也创立了独特的产业级LTV建模方法,通过引入Order Dependency Monotonic Network (ODMN)来针对时间跨度与LTV的有序依赖性建模,大幅提升模型表现,同时使用基于分治法思路的Multi Distribution Multi Experts (MDME) 模块式学习,解决了LTV数据分布稀疏对建模的困难。

详见<K, Li., G, Shao., N, Yang., X, Fang., Y, Song.(2022) Billion-user Customer Lifetime Value Prediction: An Industrial-scale Solution from Kuaishou,Available at https://arxiv.org/abs/2208.13358>

论文链接:https://arxiv.org/abs/2208.13358

04

如何实现设备粒度的LTV预估

如何实现设备粒度的LTV预估,总结下来就是数据和模型这两块。

快手用户增长 LTV 模型及其应用

数据基建是一个金字塔型阶梯式的数据积累。

最底层是DAU的特征积累,即对DAU各种特征做数仓建设,对LTV的用途做模块化管理,比如把生产侧的某种指标聚到一块,实时地更新特征库。

第二层是对不同cohort的模型圈选人群,其中cohort是指人群等,比如需要做设备粒度的LTV预估时,预估模型需要圈选人群,该人群可能是MAU、DAU等,根据圈选出来的人群决定画像和时效性。

第三层是聚集所有的特征,去得到训练/预测集等,就决定了特征的复杂性、模型的复杂性、训练更新频率等。

第四层是线上的多维实时数据源,偏维度项、偏实时的数据,即在模型预测或训练时才加进来的一些比较简单的数据。最顶层最终预测输出,预估的LTV价值。

快手用户增长 LTV 模型及其应用

模型基建分为三块。

第一块是只用一个模型框架承接整个探测数据、特征处理、训练、预测,结果评估等完整流程,即该模型框架需要可以支持完整流程,并且有很强的拓展性,有一定的复用性。

第二块是内部有工具去部署任务、管理机器资源等,无论是用airflow,还是内部自研的工具。

最后一块是日常监控,包括预测异常监控、模型准确率监控、特征变化监控,比如监控是否准时产出、特征变化等,监控特征是不是从某个时候开始偏移了,整个分布都变了,则对应模型不再适用,因此都要从各个维度,比如预测的结果、模型的准确性,还有特征等都要做监控。

05

LTV如何应用?如何撬动更大的价值?

最后介绍一下LTV如何应用以及如何撬动更大的价值。前面讲过的白盒化和此相关,通过模型可以榨取出白盒化的一些产品洞见。

对新增用户进行建模时,可以做画像切片,筛选出高价值的用户,然后针对性地做一些买量策略;也可以预测时序上的变化,预估真实的LTV是怎么样变化的,也可以预测具体的特征是怎么样的变化及其正、负相关性等,因此可以对整体的产品策略有一定的指导。

快手用户增长 LTV 模型及其应用

对活跃用户进行建模时,可以评估日常促活的一些策略的长期价值,也可以分析该模型重要的特征,从而做一些产品策略的指导。如果知道决定活跃用户预测重要的特征有哪些,可以对产品整体有宏观的理解,并且从这些特征出发,可以做更多的事情。比如相关特征涉及两个产品线的一些重要指标,这两个产品相互冲突和竞争,此消彼长,就可以知道哪个指标对用户的长期价值更重要,也可以知道该如何看待两个产品的重要指标,以及如何衡量其重要性。

还可以通过分析LTV预测的变化,得到生命周期变化的预警。比如长期观测一个用户的LTV 预估的变化,可以找出LTV涨跌趋势,无论是涨还是跌,都可以映射到高活跃、中活跃和低活跃中,就可以获得活跃用户活跃度扭转的预警。

对回流用户进行建模时,和新增用户类似,对于回流的用户可以做策略优化。比如通过做用户画像切片,可以知道已流失的用户或拉回的用户中哪些用户的价值更高,然后针对性地优化拉回策略。

今天的分享就到这里,谢谢大家。


分享嘉宾:井冬萍 快手 数据科学家

编辑整理:易双凤 vivo

出品平台:DataFunTalk


01/分享嘉宾

快手用户增长 LTV 模型及其应用

井冬萍(Sunny)|快手 数据科学家


快手增长和生态分析中心的数据科学家,曾任职于北美LinkedIn,毕业于芝加哥大学。负责过的工作内容包括用户增长数据分析、用户长期价值预测、实验平台异质性因果、国际化实验平台搭建等。目前主要负责快手的用户增长LTV模型


02/关于我们

DataFun:专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请超过2000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章800+,百万+阅读,15万+精准粉丝。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/63828.html

(0)

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信