APP推广合作
联系“鸟哥笔记小乔”
IBM大佬漫谈留存
2021-03-17 18:45:12

作者/Simba

欢迎回来,本篇从一个基本概念——留存谈起。面试的时候“留存”也是大概率会被问到的一个问题,如果想确认自己的回答怎么样,我们一起探讨一下。本文约4000字,读完需要10分钟。

01 留存怎么算

“留存不就是用户在未来xx天的使用情况么,比如第一天拉新1000,第二天有100个人来了,留存率10%。” 这个算法本身没有问题,就比如前文中的一个例子:

有一个鼓励试用的活动持续2天,我们来看3日留存率的计算。

  • 10月1日,1000人试用;第一天这1000人中300登陆CRM软件;第二天,有200人登陆CRM软件;第三天,有150人登陆CRM系统。

  • 10月2日,1500人试用;第一天有400人登陆CRM软件;第二天有200人登陆CRM软件;第三天有150人登陆CRM系统。

那么针对10月1日和10月2日这两天的活动,三天的留存率分别是这样的(蓝色内容所示):

但是要反映整体活动的3天留存率,应该怎么计算呢。我的方法是,把这几天活动中第X天的留存总人数,除以这几天拉新的总人数,即:

  • 第一天整体的留存率为:

    第一天的留存的总人数之和/这几天活动拉新的总人数

  • 第二天整体的留存率为:

    第二天的留存的总人数之和/这几天活动拉新的总人数

  • ……

以此类推,如下图中绿色内容所示:

这也是我在上文中提到的方法,然而一位小伙伴提出了他的看法(如果这位小伙伴看到此篇,可以联系我哦~)。

于是我把具体计算方法放在更大群体里讨论,不同的声音出现了,那种情形就像一帮南北方朋友在我家聚餐,我在西红柿炒鸡蛋里准备放糖,被一个北方人看到后大声质疑:“西红柿鸡蛋不要放糖啊”, 然后另外一帮南方人马上回答“啊,当然要放糖啊”。

“留存算同一周期下的平均值会好一点, 不是和的平均,而是百分比的均值”, 所以这里的另外一种方法是这样的,把两天的留存百分比加起来,除以总天数,即:

  • 第一天整体的留存率为:

    (10月1日的day1留存率+ 10月2日的day1留存率)/2

  • 第二天整体的留存率为:

    (10月1日的day2留存率+ 10月2日的day3留存率)/2

  • ……

以此类推(如下图橙色内容所示):

貌似两种算法看起来结果都差不多,可是又有另外一个声音出现了:

“一般情况下两种算法所得值差不了太多,但是如果两天的拉新数量差别很大,留存比率差别也大的情况下,就会出现不一致的情况, 比如下面这个例子,按照第一种方法算出来是2.75%, 第二种方法算出来是46%。”

哇,那要怎么算。“第二种用加权平均去算就好了,权重可以用拉新人数来算。”于是衍生了第三种算法,但仔细一看,按照拉新人数加权算其实和第一种算法是一样的(如下图第三行浅绿色所示)。

此时另外一个声音将话锋转移到一个新的问题:“先不去讨论对错,你们有想过这两种算法在业务应用上的差异点么?忽略场景而言,对绝大多数运营的人来说,肯定会先盯这个数字;因为第一条数据里98%的流失,需要反思的事情太多了,后面的更容易去做策略的落实,有方向和动力。”

所以为了体现这种异常,我们需要全局全细节的留存信息,就回到了最初的阶梯式留存表格,利用热力图将异常值高亮显示(比如下图),让业务人员一眼看到异常来展开分析,并且这些异常值后面往往蕴藏着机会或者风险,或者——bug。

但是,如果要更准确的体现整体活动的3天留存率,我们又需要将这些异常值剔除掉来计算留存率,剔除的方法多种多样(大家可以参考Python 库Pyod的各种算法,在这个Kaggler 分享的PDF中有各种详细算法:https://www.kaggle.com/getting-started/104950)。在剔除异常数据的情况下,无论采用第一种算法或者第二种算法,差别并不大,对于业务的价值是差不多的,如下图所示。嗯,这下问题可以稍作终结了。

然而,关于留存的探讨并没有到此为止, 搞清楚留存计算后,作为一名优秀的数据分析师,既要知道留存数据怎么算,也要知道留存数据怎么用的问题。

02 留存怎么用

搞清留存计算之后,我们问一下,为什么要看留存?千万不要觉得这是产品经理的事情,数据分析师们只有明白了为什么,才能更好的提供准确可靠的数据。留存的用处之一是通过留存率和其他要素的情况下,预估公司收益(这也是数据分析师在面试时经常遇到的问题),但留存数据的用处可远不止于此。

笔者曾经在一篇文章里看到这样一句话 “Without retention, your product is a leaky bucket”,翻译过来是“没有留存,犹如竹篮打水一场空” (或者翻译更形象一点,“没有留存,你的推广就是个无底洞”),好不容易拉新的客户,全部又流出去了。而在互联网下半场的浪潮里,另外一种增长黑客模型早已经浮出水面,即由AARRR 模型转变为RARRA,如下图所示,在RARRA模型中,留存--Retention 首当其冲,即先实现留存,再去做产品推广,让产品自己去运营,实现获客。

张小龙的[微信十年]相信不少人看过,演讲中所提的:“这是一种典型的微信style的产品方法,即通过产品而非运营的方法,找到事情的撬动点,通过产品能力让事情运转起来” 和RARRA的理念高度一致。我们今天就蹭一下热点,用留存的框架“套路”一下微信视频号的成长过程,纯属学习视角的讨论,欢迎大家拍砖留言。

个人认为RARRA增长模型下,产品成长过程中有以下几个阶段,而留存在是这几个阶段都需要关注的指标之一:

  1. 找到Market Fit,这个阶段留存分析能帮助产品发现“生存能力”。

  2. 培养初期留存用户的使用习惯,持续优化核心功能,这个阶段留存分析能帮助产品发现“基本能力”。

  3. 让更多的人看到核心功能,使产品被更广泛的人使用,这个阶段留存分析能帮助产品发现“价值能力”。

详细展开来说一下:

阶段1:找到Market Fit(即产品与市场的契合点),这个阶段留存分析能帮助产品发现“生存能力”。

微信视频号找到Market Fit 的过程是这样的,“以下摘自张小龙《微信十年》原文”。

“可能在2017年吧...但后来就不了了之了...

第一个版本其实只是搭建了这样一个ID体系,但这样的效果并不好...

但头几个月的滚动特别困难,似乎陷入了死结…

(2020年)5月份的时候,我们做了视频号最重大的一个改变...于是五月份发布了基于朋友点赞的新的灰度版本,终于看到了上扬的数据,用户的留存非常高。”

不知道大家看到这个过程是什么感受,我在想,作为业界“顶级产品的顶级产品经理”,都经历了如此多的曲折来尝试新事物,我们又有什么理由不去承担风险,快速试错呢?

那么龙哥所提到的“上扬的数据”是什么呢?什么样的留存曲线算是找到了Market Fit, 如下图所示,绿色代表没有找到Market fit 的留存曲线,蓝色代表找了market fit 的曲线,显示出“上扬”的趋势。当然这个过程并非像这条曲线这样简单,只是为了学习,我将这个曲线做了简化处理。

阶段2:培养初期留存用户的使用习惯,持续优化核心功能,这个阶段留存分析能帮助产品发现“基本能力”。

“以下仍然摘自张小龙《微信十年》原文”。

“所以6月视频号的用户到了一个量级。数字其实不重要,但对于一个内容形态的产品来说,一定量级的用户意味着解决了生死问题,即流量的循环起来了... 有这个用户基数说明生存下来了,这时候就可以开始做基础功能的完善了,比如直播能力等。没有过生死线的话,做再多功能也是白搭。”

注意到没有:“一个量级..数字其实不重要..做基础功能的完善”,意味着在阶段1解决生存问题之后,数字的增长并没有作为重点来看,而是开始做“基础功能的完善”。即在第二个阶段,就是要不断刺激这部分用户持续使用,黏住他们,从而得到长期的留存,所以你看到的简化后的留存曲线的变化可能是这样:

阶段3: 让更多的人看到核心功能,使产品被更广泛的人使用,这个阶段留存分析能帮助产品发现“价值能力”。

这里谈一点我对微信视频号的观察,目前在我周围的人群中,微信视频号的用户占比不算太高,大部分人仍然觉得视频号是像抖音一样是杀时间的机器(目前的确也是)。原谅我周围的人都比较勤奋,不是“围观群众”,不愿意将时间花在消遣类的社交上 。但同时我也看到越来越多的高管、精英人士、原来写公众号的,开始做微信视频号了,趋势是好的。所以,个人感觉微信视频号目前仍然这个阶段3。至于微信视频号能否走好阶段3,未来拭目以待。

那么,在产品的这个阶段,如何利用留存分析帮助产品发现“价值能力”呢?我们大体可以把用户分为新用户、已有用户、已流失用户来分析。

  • 新用户的留存分析:找到能让新用户再次回来的事件(从阶段2中挖掘),利用这个事件改进产品的第一印象,从留存曲线上来说,新用户的留存曲线的变化更倾向于下图这种。当然为了夸大第一印象的作用,我们把这个留存曲线简化了很多。


  • 已有用户的留存分析:可能有些人说,已有用户是不是意味着已经留存下来,就不需要做留存分析了。恰恰相反,这部分用户的留存分析最能体现出产品的核心价值,即利用已有用户的行为痕迹帮助我们理解“产品能给用户带来什么价值”。

拿视频内容产品来举例,使用者可能是希望用视频做品牌宣传,可能是为了找到自己的圈子学习专业领域知识,也可能是为了好玩,可能还有一些我们也看不到的价值。我们按照行为我们把视频内容产品的用户粗略分成两大类(其实还可以细分),创作者和观赏者。针对两类角色我们需要定义不同的留存标准:

1.创作者的留存定义可能是这样的:

  • 留存初始行为是发布视频

  • 留存后续行为是发布视频

  • 时间频率是每周,或者是其他定制化天数

即距离上一次发视频不超过一周(或者是其他定制化天数)又发了一次视频的用户为创作者的留存。

2. 对于观赏者的留存定义可以是这样的:

  • 留存初始行为是观看视频

  • 留存后续行为是观看视频

  • 时间频率是每天,或者是其他定制化天数

即距离上一次看视频不超过1天(或者是其他定制化天数)又看了一次视频的用户为观赏者的留存。

你看到的简化后的留存曲线可能是这样的:

通过对不同行为群体进行留存分析是对产品细分价值的判断,我们可以帮助产品构建出一个健康的增长引擎。

  • 已流失用户的留存分析:

    为什么流失的客户还需要留存?

    因为我们需要把老客户拉回来。

    有研究表明重新激活老客户实际上比获新客成本更低。

    这些用户可能是你在第一阶段获取的用户,因为彼时产品对他们来说价值不大,但到了第三阶段,或许到了一个赢回他们的好时机:

    适宜地组织老客户拉回活动,告诉他们最近产品的变化(而不是骚扰式的push), 是不是会更有效。

    在做这样一些活动时,我们同样需要观察客户重新拉回的留存率,用于评判产品的变化是否具备拉回“已流失用户”的能力。

    把时间拉长,这部分的留存曲线甚至可能是呈现“微笑型曲线”。

当然上述的留存分析在产品不同阶段的应用并不是一概而论的,只能说在不同的阶段,我们的留存分析有不同的侧重。不变的一点是“留存分析” 在产品的全生命周期都扮演着非常重要的角色,尤其是在当下互联网产品百花齐放的时代,留存显得尤为重要。

03 总结

留存是当下互联网产品重要的评价指标,也是当前形势下增长黑客模型的第一要素。本文从两个角度对留存分析进行讨论:

  • 留存怎么算,我们需要提供一个准确的留存率分析报告,这更多是数据分析师的职责。

  • 留存怎么用,如何运用留存分析来推进产品迭代,以实现产品增长,这更多是产品经理的职责,但是作为数据分析师,理解数据的运用也同样重要。

当然,本文是抛砖引玉,欢迎各位数据分析师、产品经理、数据产品经理一起探讨,若有错误不吝指正。

-END-

分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
一个数据人的自留地
数据人交流和学习的社区,关注我们,掌握专业数据知识、结识更多的数据小伙伴。
确认要消耗 0羽毛购买
IBM大佬漫谈留存吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接