【万字长文】:小数据时代医疗产品如何突破(1)

大家好,我是点点医生事业部的技术开发,公司ERP系统负责人,曾参与开发点点医生的后台,点点医生的冷启动,在线咨询,支付与退款,名医视屏(更名为名医讲堂),运营大数据屏幕的数据接口等。

今天这场分享主要是针对[点点医生]

尽管我们以各种意想不到的方式在不同的场合绽放光彩,但是今天已经不是一个简单的数据时代,而是如何用好小数据的时代。看大数据,不如用好小数据。【点点医生】,成就属于我们的小数据时代。

今天,我们的主题:医疗产品的小数据分析-点点医生


一、医疗产品如何拉新促活

用户来了,我们通过提升留存漏斗模型优化关键节点,通过种种运营手段提升次日留存,来提高日活。

医疗产品如何拉新促活?

不可能。

为什么这么说?

问题来了:用户今天不在作图软件作图,用户今天不挂号软件上挂号,那么用户来做什么呢。

比如:支付宝做社交。

…为什么支付宝的眼里都是泪水…

核心:不以用户活跃度,而是以品牌影响论英雄

即,我们的目标是:积累用户口碑。

用户觉得产品好用,才是产品的成功之道。

而产品好用的核心关注点:功能使用频次,功能使用时长,用户没有完成最终目标退出的比例。

即考核功能的易用性,产品价值度。

二、文章质量评价体系和数据抓取

注意:文章的传播力和的自身价值没有必然的关系。

一篇很好质量很高的文章,可能收藏量、点赞量很多,但阅读量、传播量不一定很大;相反,很多价值不大的文章,因其易读且迎合用户部分心理需求,传播力会大不少,阅读量和转发量“蹭蹭”的上涨。

多维度分析

一套完整、全面的文章/内容评估体系,归纳出的微信文章/内容质量评估体系,共罗列出了5个维度,即粉丝增长指标、粉丝活跃指标、文章信息指标、文章传播指标和文章价值指标,5类指标下又包含若干类型数据,尽量将分析的“颗粒”细化。

抓取数据指标的信息汇总表格

image

详情见图:

image

2.1粉丝增长指标

粉丝增长指标反映粉丝在某天当中的增长/取关情况,下面涵盖3类数据—新关注人数、取消关注人数和净增关注人数。

其中,“新关注人数”和“净增关注人数”是正向指标,也就是越大越好,而“取消关注人数”则是反向指标,越少越好。

在不做活动的情况下,这3个指标综合起来看,可以反映出当天总体人群的阅读质量怎样—阅读量足够大,文章足够好的情况下,粉丝的增长会多,取关的人数会少;假使标题党,诱使粉丝阅读或关注,粉丝的取关数量会很多。

2.2粉丝活跃指标

粉丝活跃指标反映了所关注粉丝的活跃度情况,这里包含有图文阅读人数、公众号会话阅读人数和来自历史消息的阅读人数。

值得注意的是,这3个指标都是发文后7天内的统计数据,具有一定的时效性,能反映出粉丝对本公众号的关注/重视程度(如果不重视的话,可能过很久甚至从不打开,出现极端的情况是,文章从朋友圈或是好友转发处看到。)

其中,“图文阅读人数”是7天内对某篇文章的总阅读用户数。“公众号会话阅读人数”是指从公众号推送的会话里打开的,反映出读者已经养成了在订阅号里查看推文的习惯,有一定忠诚度和活跃性了。从历史消息里看,可能有两种情况:一是粉丝新关注公众号后,会在历史消息里翻阅过往推文,表示ta对公众号的内容很感兴趣;另一种情形是,粉丝忘记查看之前的推送消息,看到目前的这篇后,会兴致盎然的查看过往推送记录,两者都反映出粉丝对公众号的感兴趣,能体现粉丝活跃性。

2.3文章信息指标

文章信息指标是文章发布的基本信息,包含文章标题、文章发布日期和文章发布时间点。

这3类数据/信息不能单独进行分析,需要结合其他维度的数据进行关联分析,用以判断文章质量的优劣。

2.4文章传播指标

文章传播指标反映微信推送内容的传播力度/效率,因为在一般情况下,微信推文的生命周期基本维持在一周(绝大部分的阅读量在此期间完成)。该指标下辖4类数据—从公众号分享到朋友圈人数、在朋友圈再次分享人数、在朋友圈阅读人数和来自好友转发的阅读人数,这几个指标都是发文后7天内的统计数据,具有一定的时效性,能反映文章在7天内的传播效果。“从公众号分享到朋友圈人数”指粉丝在公众号会话里查看推送内容后,再转发到朋友圈再次被阅读的人数,也称之为“二次传播率”;“在朋友圈再次分享人数”和“来自好友转发的阅读人数”可以理解成“三次传播率”,它们的传播路径过于复杂,见下图所示:

几种不同的阅读路径

2.5文章价值指标

文章价值指标表示阅读者对文章内容的认同和赞许,认为文章给他们带来了某种价值(如心情放松、获得新知等),该指标下辖4个指标—总阅读数量、分享人数、微信收藏人数和点赞数量。

其中,
分享人数、微信收藏人数是发文后7天内数据,而阅读数量和点赞数量是文章从发文之日起至今的总数量。

各指标抓取位置及涵义

2.数据清洗

数据清洗,并进行K-M均值聚类分析,进行文章价值度的分类。

K-M 分类数据

image

3.数据处理

image

  • 第一类:传播力非常强,在一周内传播时效性显著,但粉丝增长度低,且文章具有非常高的价值(对目标用户来说很“值”),同时相应的粉丝也非常活跃;
  • 第二类:文章一周内的传播力较强,粉丝增长量较高,文章的价值度较高,粉丝活跃性良好;
  • 第三类:文章传播效率地,粉丝取关量大,文章价值度低,粉丝活跃性非常差;
  • 第四类:文章传播效率一般,粉丝增长量较大,文章价值度一般,粉丝活跃度一般;
  • 第五类:文章传播效率一般,粉丝增长度一般,文章价值度一般,粉丝活跃度一般。

可以进一步将上述指标数据值进行标准化,文章各指标的量化表:

image

第一类文章

从上表可以看出,这篇文章的传播效果和文章价值度、粉丝活跃度都非常好,但粉丝增长量很小。一个抢点借势、内容区分度较好的文章。

第二类文章

第二类文章的各项指标相对均衡,是这五类文章中质量最佳的类型。

第三类文章(局部)

第三类文章在这5个分类中属于“最差”的,其中的营销类(广告)较多,再就是讲座类的内容,缺少“干货性”的内容,不符合目标受众的口味。

第四类和第五类

依次类推,需要结合各项指标来进行诊断分析,得出规律性的结论。

image

三、 文章数据的描述性分析

3.1 文章标题

先对文章的阅读量”、“点赞量”、“收藏量”、“正文字数”和“标题字数”进行描述性统计分析,获得这些数据的“第一印象”
image

部分数据解读:

  • 单篇文章阅读量的最大值是63520。
  • 读者的评论较稳定,50-70之间。
  • 文章字数均值1400,偏差较大,当然大多数文章都有配图。
  • 标题字数28左右

image

阅读量与正文字数、标题字数之间的关联分析
分别对“阅读量”与“标题字数”、“正文字数”做了散点图分析,以期判断它们之间是否存在相关关系。

image

从上图来看,阅读量和标题字数之间并没有明显的线性相关性,标题字数及其对应数量的散点分布,近似形成了一条左偏态的正态曲线,从图像上印证了上面的描述性分析,而且更新了我们的认知:在25~30这个“标题字数”区间的文章数量最多。

image

从上图可以看出,从1500字开始,阅读量和正文字数在大体上呈负相关关系,即文章字数越多,阅读量越小。由此看来,大家都比较喜欢短平快的“快餐式”阅读,篇幅太长的文章看起来太磨人。。。

3.2 公众号的内容

后台聚类分析,得出下表:

目标人群的群体画像及其阅读偏好

建议:吸引年轻用户群体

方法:

  • 1.文字增加动图、表情包等使文章整体风格保持清新
  • 2.开通微博引流

3.2.1 用户精准度分析/验证

用户来源、渠道分析,用以判断粉丝的来源路径

粉丝关注的来源

用户的来源分析,如上图红色虚线框所示,主要分为公众号搜索、扫描二维码、图文页右上角菜单、图文页内公众号名称、名片分享、支付后关注、其他。它们间接反映的用户行为如下图所示:
粉丝来源及对应行为分析

对本公众号的粉丝来源进行整理,(图略),本公众号粉丝来源细分

数据可知

本公众号的粉丝绝大部分来源于“扫描二维码”,其次是公众号搜索,名片分享。

结合“粉丝来源及对应行为分析“,

“扫描二维码”行为解释:

  • 图文阅读后关注
  • 地推

对于粉丝以“图文页公众号名称”为主的加关注行为有如下几种解释:

  • 本公众号名称具有吸引力,引导粉丝关注
  • 粉丝被引导关注的标题吸引
  • 文章质量较高,粉丝第一时间关注
  • 通过“扫码二维码”这个路径进来的粉丝,意味着ta是在阅读完文章后加关注的,此类粉丝较“图文页公众号名称”进来的更为挑剔,同时也反映这类粉丝更为“死忠”和精准,质量很高。
  • 在2017年6月23日,来自其他渠道2073个新增粉丝,异常(6月21日发文为第三类)。
    2017年8月7日,来自其他渠道1854新增粉丝,异常(8月7日发文为第五类)。
  • 10月9日《长痣会变恶》,9月26日《每天掉多少头发》,8月14日《20岁小伙洗澡》,5月11日,5月3日护士节投票活动分别被不同平台转载,明显可以看到阅读量的提升,通过“公众号搜索”加关注的粉丝增多。
3.2.2 内容分析,优化公众号的结构和内容

内容优化判别

诊断问题和发现规律
按照图文分析—>全部图文, 在“趋势图”下方找到“导出excel”这一项,设定好日期区间,将这些数据进行导出:

导出的图文数据中,无论是“图文页阅读”、“从公众号会话打开”、“从朋友圈打开”、“分享转发”还是“微信收藏”,都有“人数”和“次数”这2个类别,为了精简分析项目,只保留了每个分析指标里关于“人数”的部分。经整理,整合粉丝数据和内容数据,得到 “日期&粉丝&阅读&内容”对应热力表,将此表命名为“发布内容信息诊断表”。

注:

一次转化率=公众号打开人数/累计关注人数(千分比)

二次转化率=从朋友圈打开人数/累计关注人数(千分比)

发布内容信息诊断表

识别这些天发布内容的优劣情况及发布时间上的规律,起到诊断问题和发现规律这2个作用。

诊断问题

文章的转化率情况:

会话占比高真的好吗?

首先来看数据概况中的“阅读来源分布”图。

下面是两篇头条文章的阅读来源饼状图,考考大家觉得哪个阅读量会更高?

image

答案揭晓:左图文章的阅读量是右图的近十倍。

一篇文章阅读来源中的“朋友圈”和“好友转发”代表着它的传播量,如果这两者占比很高(如左图),说明这篇文章二次传播得很广,阅读量自然会蹭蹭上涨,还会带来更多新粉丝。

但如果“公众号会话”占比很高(如右图),只能说明二次传播效果不理想。就算是用标题党让很多用户点了进来,也很难有后续的阅读数上升。

更加深入的分析需要点进“数据概括”旁边的“详情”,这里显示了大家都很关注的转化率。放张截图:

image

可以看到图上有两个百分比数字,第一个就是通常所说的图文打开率,计算方法是:公众号会话阅读人数/图文送达人数。

据说:打开率基本都不足5%,正常的可能在2%-3%的样子。

第二个百分比代表的是:看了公号推送的读者有多少转发到了朋友圈。这个数字基本反映了文章的传播情况。

据说:2%左右。

长期观察这两个数字,能对公号内容存在的问题有个大致了解。

可以看出,阅读量的来源绝大部分在一次传播上,粉丝粘性不强,用户二次转化率极低。

发现规律(考虑删除)

发现合适的内容方向

在发布时间和发布渠道固定的情况下,可以判断出是内容上的改变带来了这些数据的协同增长。

image

从上表中可以看出,用户感兴趣的健康科普知识方面。此外,用户倾向于图片式的展现形式,这样的阅读体验更为直观和亲和。上述关于内容方面的选题和形式的经验,可作公众号文章素材查找、撰写和编排的方向的参考。

四、非结构化文本数据 (考虑删除)

以【几乎所有孩子都中招】为例

4.1 语义分析实体抽取

image

4.2 词频统计

image

image

image

4.3 词向量统计

image

image

4.4 关键词权重统计

image

建议

优化微信后台统计数据

  • 1.有关联性的数据,呈现不够集中,不够直观
  • 2.部分数据的采集,必须手工完成,汇总繁琐
  • 3.无法展现某个时间段的多个模块的数据表
  • 4.部分数据的更新是实时的,无法及时监测到时分级的增量浮动情况
  • 5.单篇图文的数据分布太分散,导致加总计算数值对不上。

如何提高文章价值度

你内心有没有产生过疑问:

“文笔流畅,思路如泉涌的你,文章阅读量怎么那么可怜呢?”

小数据分析,统计一般性的规律。(只作数据分析交流用)

1.创造用户阅读兴趣

我们在分享干货知识的时候,喜欢“直接教给别人”,比如

“秋季要“四防”,若不注意小心落下病根! ……”

或者:

“这6种人最易招来癌症!你是否也在其中?”

这样的思路简直像标准的议论文一样“开门见山”,直接告诉别人答案。

++它们无法让吸引读者看下去++。

因为:当你说“秋季要“四防””之前,你并没有让读者产生“我很想知道”的渴望;

当你说“这6种人最易招来癌症”之前,你也并没有让读者产生“我很想知道具体有什么方法可以预防”的渴望。

这些文章在读者产生了对答案的渴望之前,就给出了答案。

而这肯定是无效的。

如果你想卖米饭,就得想办法先让对方饥饿。

如果你推销笔,就请对方为你签个名。

如果你想让你的答案被人读下去,就得先让对方产生对答案的渴望。

创造用户兴趣的方法
  • 1.违背直觉

违背用户第一直觉的部分。

举例:

《啪啪啪时,这个面部表情要留意!》

《20岁小伙洗澡后竟患上这种病!这个危险动作常被你忽视》

  • 2.指出错误

《几乎所有孩子都中过招!避开这6个常见误区,让宝宝好得更快》

《你的一举一动都离不开它!这些习惯却在加速它的老化!》

知乎:实名反对楼上所有答案

  • 3.成功激励

《不容忽视!现代人都有这些症状!跟着专家这样做,轻松拥有好脾胃!》

《它能救命亦能误命!权威药师亲授的“干货”,你务必收藏!》

提高价值度方法
  • 哦,原来如此

举例:

让用户“在熟悉的事物中看到新的解释”。

《你的一举一动都离不开它!这些习惯却在加速它的老化! 》:

爬山、跑步、跳舞……你的一举一动都离不开它——关节的帮助,可你是否有感到过膝关节的活动不畅,甚至隐隐作痛呢?

其实这些都是关节发出的“求救信号”,大多也是关节损伤、老化的早期症状。

是的,“看到”并不意味着“观察到”,如果你能把文章的理论联系到别人可以“看到”但是“观察不到”的事情上,就会提高文章的启发性。

这也是所有的谜语、迷宫让人看到答案后产生“启发感”的原因—所有人都能看到谜语,但是他们往往猜不出来。这时候如果突然呈现了答案,就会产生“启发感”。

这也是所有的侦探剧、悬疑剧引人入胜的精髓—导演把所有的线索都给你了,但是知道最后,你才突然发现“原来他才是凶手”。

就像夏洛克的经典台词说的:You do see, but you don’t observe.(你看得到,但是没有观察到。)

如何刺激用户疯狂转发

首先,用户什么情况下会分享。

有一个心理学教授曾召集一批人做一个关于三明治喜好的测试,作为回报,被试者可以拿到一定的实验酬劳。

在试验中,这些被试者有2个选择:
1,什么都不做,多获得25%的酬劳;
2,可以把自己关于三明治的喜好分享给周围的人,酬劳不变。

最后的结果是什么?大部分人宁愿放弃25%的酬劳,也要把自己关于三明治的喜好分享给别人。

也就是说,分享转发本身就是向吃饭一样的天生欲望,是不需要金钱激励就会自动去做的事情。

再举个例子,你拍下某个明星出轨的照片!

  • 给用户提供有价值的信息。

这也是上文提高文章价值度的初衷。

如果你的信息也能够帮助别人表达想法、说出自己内心想说的话,他们就会自动分享、传播你的信息。

在社交中,几乎所有的人都渴望能够表达自己的想法来影响他人。而如果你的信息能够在这个过程中提供帮助,他们就会转发你的信息。

举例:

朋友圈中经常看到公司老板们分享这些文章:

《致加西亚的信:全力完成任务的,才是好员工》
《细节决定成败:员工最让老板感动的8个细节?》
《情商为王:跟客户打交道时如何压制自己的情绪?》

同样,我们在朋友圈中也经常看到基层员工分享这些文章:

《70%的优秀员工都是被平庸的中层管理者折磨走的》
《研究发现:过度加班反而有害工作效率》
《员工更加勤奋,就能弥补高管在战略上的失误吗?》

  • 比较心理

在小圈子之中分享和比较的动力,正在大幅超越分享给所有人和所有范围。用户在小圈子中炫耀获得的成就感,远远超过在泛人群中获得的成就感。

举例:

大V店,深究这个产品,发现无数用户在自己小区内组织的读书会等社群行为,帮助它建立起了客均单价800元左右,用户次月复购率50%的亮眼数据;

狼人杀英雄榜背后,无数“法官”自发组局、互相PK游戏排名的行为,帮助这款产品用户数昂扬直上,划出一根非常美丽的增长曲线;

也帮助知识星球成为2017年最优秀的社群产品之一、以及闺蜜圈、分答等一些明星级应用。

。。。


只要有人的地方,就一定有比较——不论这种比较是显性的还是隐形的。

人们可以接受在平均年薪3万的公司里拿到10万年薪,也很难接受在平均年薪100万的公司里拿30完年薪。

即使是没有意义的比较,人们也往往乐此不疲。

所以在2015年刚开始时,几乎所有的互联网公司都丧心病狂地开始用各种手段引发比较:

支付宝推出了10年账单的功能,可以让人瞬间了解自己过去10年支付宝花的钱并转发朋友圈。

微信6.0新版本发布,用户可以分享自己过去1年得到了多少赞、送出了多少赞。

知乎可以让用户知道自己过去一年答了多少题、得了多少赞,并且生动地用语言表现出来。比如“在2014年,您的答案被浏览202万次,超过了《细菌、枪炮和钢铁》的总销量。”

百度地图也推出功能,让用户可以分享自己过去一年去过哪些地方……

甚至每次微信群抢红包,大部分人都会比较一下谁强得多。

还有开机时间,告诉你打败了99%的小伙伴……

实际上,“设计一种游戏,引发用户的比较”这种诀窍早在互联网出现之前就有了。

比如线下的各种会员卡、积分卡、贵宾卡……

深刻了解社群中人们的行为习惯、社群运转的规律,并将之结合在自己的产品和运营中是一个关键所在。

结语:

所有人都需要社交,而如果你的信息能够帮助对方社交的某个过程(不论是提供价值,还是个性化),就相当于提供了一种用户刺激,他们就会转发你的信息。

五、产品管理建议

明确使命:给【点点医生】定一个目标

很多时候,我们只是拉了一群人,却没有设计一个共同目标,即使你再用力发红包,用户仍然和你“各取所需”,产品设计仍然偏离初衷。

我们应该设计一个和用户共同完成的长期目标。

六、结语

我们特别希望通过【点点医生】,让那些真正关注健康的人,需要专业健康指导的人,看到一个由更专业的医生团队支撑的医疗模式是更加高效,更加安全,更具价值的。

我们特别希望通过【点点医生】,让那些真正做医疗的人,拥有数据的人,制定政策的人,看到一个由更专业的技术团队支撑的医疗模式是更加高效,更加安全,更具价值的。


下期预告:

主题:

  • 活跃用户研究

  • 流失用户监控

  • 社群运营十问


欢迎关注:一只阿木木
关注数据,挖掘数据