本文简单梳理一下数据分析的基本内容,概括来说就是:2个目的+6个步骤+6个方法+8个思路+8个模型。

先分享一套数据可视化模板,涵盖各大核心业务和行业场景,点击即可免费下载:数据分析可视化全套模板

一、2个目的

举个例子,某电商双十一跟着淘宝做了一个大促活动,事后想了解活动的效果,于是找到了小王。 于是,小王开始收集数据、处理数据、建立模型、制作报表。最终得出结论:活动期间UV上涨了50%,订单增长了40%,销售额提高了45%云云。

这叫做据分析吗?当然不,因为小王根本没有找到数据分析的目的,只是单纯的统计数据而已。没有目的,自然也就不会有结论,而这两者是数据分析最关键的两点。

再举个例子,该商家感觉最近销售量有点低,想做个分析看看是什么原因。 于是小王结合平台的流量数据,订单数据、用户数据,采用聚类分析、主成分分析、相关行分析等分析挖掘手段。发现男性群体的销售量明显下滑,需要提高对这类人群的引流。

这叫做数据分析吗?是。那么数据分析成功了吗?并没有。

这次小王知道了问题是什么,还用了很多算法,但是没有做目的性的引导,是分析失败的主要问题。业务不了解数据,数据不了解业务,这种衔接矛盾常常存在。

总结来看,数据分析的目的是整个研究方案的起点,决定着后续研究的内容,数据的来源,使用的方法,其目的无非就是两个:

分析现状和过去——有问题了,通过数据分析寻找原因,制定决策

预测未来——有新项目、产品、方案要上线,或企业制定大决断,需要数据分析结论做辅助参考

 

数据分析的目的往往不是那么明确,只是有个大致的方向,这个有时候业务员和领导也没有办法。所以做数据分析时要抖点机灵。

比如让你做一个用户行为分析,出一个研究方案。你一定要知道这并不是真正的需求。你需要与领导再沟通,了解他做用户行为到底是要解决什么问题,摆脱什么困境?如果领导是因为觉得客户流失率太高,想留住客户,那分析方案就应该围绕用户满意度去展开,分析的价值在于研究找到用户不满意的点,并针对这些问题提出改进建议。

二、6个步骤

 

1、明确分析的目的,提出问题。只有弄清楚了分析的目的是什么,才能准确定位分析因子,提出有价值的问题,提供清晰的指引方向。

2、数据采集。收集原始数据,数据来源可能是丰富多样的,一般有数据库、互联网、市场调查等。具体办法可以通过加入“埋点”代码或者使用第三方的数据统计工具。

3、数据处理。对收集到的原始数据进行数据加工,主要包括数据清洗、数据分组、数据检索、数据抽取等处理方法。

4、数据探索。通过探索式分析检验假设值的形成方式,在数据之中发现新的特征,对整个数据集有个全面认识,以便后续选择何种分析策略。

5、分析数据。数据整理完毕,就要对数据进行综合分析和相关分析,需要对产品、业务、技术等了如指掌才行,常常用到分类、聚合等数据挖掘算法。Excel是最简单的数据分析工具,专业数据分析工具有FineBI、Python等。

FineBI下载地址:https://s.fanruan.com/8vbwj

6、得到可视化结果。借助可视化数据,能有效直观地表述想要呈现的信息、观点和建议,比如金字塔图、矩阵图、漏斗图、帕累托图等,同时也可以使用报告等形式与他人交流。

三、6个方法

1、PEST分析法

PEST,也就是政治(Politics)、经济(Economy)、社会(Society)、技术(Technology),能从各个方面把握宏观环境的现状及变化趋势,主要用户行业分析。

宏观环境又称一般环境,是指影响一切行业和企业的各种宏观力量。

对宏观环境因素作分析时,由于不同行业和企业有其自身特点和经营需要,分析的具体内容会有差异,但一般都应对政治、经济、技术、社会,这四大类影响企业的主要外部环境因素进行分析。

 

政治环境:政治体制、经济体制、财政政策、税收政策、产业政策、投资政策等。

社会环境:人口规模、性别比例、年龄结构、生活力式、购买习惯、城市特点等。

技术环境:折旧和报废速度、技术更新速度、技术传播速度、技术商品化速度等。

经济环境:GDP 及增长率、进出口总额及增长率、利率、汇率、通货膨胀率、消费价格指数、居民可支配收入、失业率、劳动生产率等。

2、5W2H分析法

5W2H,即为什么(Why)、什么事(What)、谁(Who)、什么时候(When)、什么地方(Where)、如何做(How)、什么价格(How much),主要用于用户行为分析、业务问题专题分析、营销活动等。

 

该分析方法又称为七何分析法,是一个非常简单、方便又实用的工具,以用户购买行为为例:

Why:用户为什么要买?产品的吸引点在哪里?

What:产品提供的功能是什么?

Who:用户群体是什么?这个群体的特点是什么?

When:购买频次是多少?

Where:产品在哪里最受欢迎?在哪里卖出去?

How:用户怎么购买?购买方式什么?

How much:用户购买的成本是多少?时间成本是多少?

3、SWOT分析法

SWOT分析法也叫态势分析法,S (strengths)是优势、W (weaknesses)是劣势,O (opportunities)是机会、T (threats)是威胁或风险。

 

SWOT分析法是用来确定企业自身的内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后用系统分析的思想,把各种因素相互匹配起来加以分析。

运用这种方法,可以对研究对象所处的情景进行全面、系统、准确的研究,从而将公司的战略与公司内部资源、外部环境有机地结合起来。

4、4P营销理论

4P即产品(Product)、价格(Price)、渠道(Place)、推广(Promotion),在营销领域,这种以市场为导向的营销组合理论,被企业应用最普遍。

可以说企业的一切营销动作都是在围绕着4P理论进行,也就是将:产品、价格、渠道、推广。通过将四者的结合、协调发展,从而提高企业的市场份额,达到最终获利的目的。

 

产品:从市场营销的角度来看,产品是指能够提供给市场,被入们使用和消费并满足人们某种需要的任何东西,包括有形产品、服务、人员、组织、观念或它们的组合。

价格:是指顾客购买产品时的价格,包括基本价格、折扣价格、支付期限等。影响定价的主要因素有三个:需求、成本与竞争。

渠道:是指产品从生产企业流转到用户手上全过程中所经历的各个环节。

促销:是指企业通过销售行为的改变来刺激用户消费,以短期的行为(比如让利、买一送一,营销现场气氛等等)促成消费的增长,吸引其他品牌的用户或导致提前消费来促进销售的增长。广告、宣传推广、人员推销、销售促进是一个机构促销组合的四大要素。

5、逻辑树法

逻辑树又称问题树、演绎树或分解树等。它是把一个已知问题当成“主干”,然后开始考虑这个问题和哪些相关问题有关,也就是“分支”。逻辑树能保证解决问题的过程的完整性,它能将工作细分为便于操作的任务,确定各部分的优先顺序,明确地把责任落实到个人。

 

逻辑树的使用必须遵循以下三个原则:

要素化:把相同的问题总结归纳成要素。

框架化:将各个要素组织成框架。遵守不重不漏的原则。

关联化:框架内的各要素保持必要的相互关系,简单而不独立。

6、AARRR模型

AARRR模型是所有运营人员都要了解的一个数据模型,从整个用户生命周期入手,包括获取(Acquisition)、激活(Activition)、留存(Retention)、变现(Revenue)和传播(Refer)。

每个环节分别对应生命周期的5个重要过程,即从获取用户,到提升活跃度,提升留存率,并获取收入,直至最后形成病毒式传播。

 

四、8个思路

1、趋势分析

最简单、最常见的数据分析方法,一般用于核心指标的长期跟踪,比如点击率、GMV、活跃用户数。可以看出数据有那些趋势上的变化,有没有周期性,有没有拐点等,继而分析原因。

2、多维分解

也就是通过不同的维度对于数据进行分解,以获取更加精细的数据洞察。举个例子,对网站维护进行数据分析,可以拆分出地区、访问来源、设备、浏览器等等维度。

3、用户分群

针对符合某种特定行为或背景信息的用户,进行特定的优化和分析,将多维度和多指标作为分群条件,有针对性地优化供应链,提升供应链稳定性。

4、漏斗分析

按照已知的转化路径,借助漏斗模型分析总体和每一步的转化情况。例如将漏斗图用于网站关键路径的转化率分析,不仅能显示用户的最终转化率,同时还可以展示每一节点的转化率。

5、留存分析

留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。衡量留存的常见指标有次日留存率、7日留存率、30日留存率等。

6、A/B 测试

A/B测试是为了达到一个目标,采取了两套方案,通过实验观察两组方案的数据效果,判断两组方案的好坏,需要选择合理的分组样本、监测数据指标、事后数据分析和不同方案评估。

7、对比分析

分为横向对比(跟自己比)和纵向对比(跟别人比),常见的对比应用有A/B test,A/B test的关键就是保证两组中只有一个单一变量,其他条件保持一致。

8、交叉分析

交叉分析法就是将对比分析从多个维度进行交叉展现,进行多角度的结合分析,从中发现最为相关的维度来探索数据变化的原因。

五、8个模型

1、用户模型

“不仅要知道用户当下在想什么,更要知道用户背后在想什么,以及用户正在经历着什么。”

传统用户模型构建方式

用户模型:基于对用户的访谈和观察等研究结果建立,严谨可靠但费时;

临时用户模型:基于行业专家或市场调查数据对用户的理解建立,快速但容易有偏颇。(缺乏时间,资源的情况下)

为了节省时间,降低风险,产品团队往往尽快将产品推向用户,快速试错,在这种场景下如何构造用户模型?

首先,整理和收集已经获得的任何可认知用户的经验和数据,将这些信息映射成为用户的描述信息(属性)或用户的行为信息,并存储起来形成用户档案,

实时关注自身数据的波动,及时采取行动

记录用户的行为数据而不是单纯地为用户打标签

360°覆盖用户全生命周期的用户档案

用户的每一步成长都通过行为记录下来,基于用户所在生命周期的不同阶段,针对新用户、流失用户、活跃用户、沉默用户分别采取有针对性的拉新、转化、留存等运营策略。

 

2、事件模型

事件是什么?

就是用户在产品上的行为,它是用户行为的一个专业描述,用户在产品上的所有获得的程序反馈都可以抽象为事件,由开发人员通过埋点进行采集,通俗讲就是:将一段代码放入对应的页面/按钮,用户进入页面/点击按钮的本质是在加载背后的代码,同时再加载事件采集代码,这样就被SDK所记录下来了。

事件的采集?

事件:用户在产品上的行为

属性:描述事件的维度

值:属性的内容

事件的分析?

人数:某一事件(行为)有多少人触发了

次数:某一事件(行为)触发了多少次

人均次数:某一事件(行为)平均触发多少次

活跃比:在一个时间区间内,触发某一事件的人数占当前时间段内所有活跃人数的比

事件的管理?

当事件很多时,可以对事件进行分门别类地管理。同时,可以从产品业务角度将重要的用户行为标注出来,以便可以在分析时方便、快捷地查找常用、重要的事件。

3、漏斗模型

漏斗模型帮助你分析一个多步骤过程中每一步的转化与流失情况。

举例来说,用户下载产品的完整流程可能包含以下步骤:

 

 

我们可以将如上流程设置为一个漏斗,分析整体的转化情况,以及每一步具体的转化率和转化中位时间

我们需要将按照流程操作的用户进行各个转化层级上的监控,寻找每个层级的可优化点;

对没有按照流程操作的用户绘制他们的转化路径,找到可提升用户体验,缩短路径的空间。

更好的利用漏斗模型:

细化每一个环节,展示到点击之间?点击到下载之间?下载到安装之间?安装到体验之间?

拥有埋点意识和全局观念,才能够有效采集,为每个环节的漏斗优化做出决策依据,推动各个部门优化

4、热图分析模型

按计算维度划分,热图可以分为点击热图和浏览热图。

点击热图:追踪的是鼠标的点击情况,进行人数、次数统计并基于百分比进行热力分布,点击热图又分为两种,一种是鼠标的所有点击,一种是页面可点击元素的点击。前者可以追踪页面上所有可点击和不可点击位置的被点击情况,后者只追踪页面上可点击元素的点击情况。

浏览热图(也称注意力热图)记录的是用户在不同页面或同一页面不同位置停留时间的百分比计算,基于停留时长。

应用场景

落地页效果分析

首页流量追踪

关键页体验衡量

5、自定义留存分析模型

定义:满足某个条件的用户,在某个时间点有没有进行回访行为

公式:若满足某个条件的用户数为n,在某个时间点进行回访行为的用户数为m,那么该时间点的留存率就是m/n

N-day留存,即第几日留存,只计算第N天完成回访行为的用户

Unbounded留存(N天内留存),留存会累计计算N天内所有完成过回访行为的用户。

-Bracket留存 (自定义观察期留存)N-day留存和Unbounded留存都是按照独立的天/周/月为观察单位计算,但有时候我们不希望受限于这种固定时间度量,我们希望划分为几个观察期

6、粘性分析

定义:对活跃用户使用产品的习惯的分析,例如一个月使用了几天,使用大于一天,大于七天的用户有多少,例如某些产品上线了新功能,用户使用需要签到,可以由此分析出用户的使用习惯,评估新功能的吸引力和健康度。

作用:使用留存分析,了解产品和功能黏住用户的能力如何,用户喜欢哪个功能,不同用户在同一功能在适用上的差异,有助于科学评估产品,制定留存策略

举例:股票APP,已投资用户和未投资的用户触发功能【查看股票市场】的次数

7、全行为路径分析

行为路径分析分为漏斗分析和全行为路径分析。与漏斗分析模型不同,漏斗分析模型是分析既定的行为转化,例如电商产品,分析从查看产品详情到最终支付每一步的转化率。而全行为路径分析是对用户在APP或网站的每个模块的流转情况,挖掘用户的访问模式,从而优化产品或网站

一般可用树形图表现,如下图,一个线上培训网站,用户大都会打开搜索课程,所以需要优化搜索课程。而在第一次搜索课程后,用户并没有搜索到想要的课程,又进行了第二次搜索,因此可以将用户搜索频率高的关键词设置成可点击元素,链接到用户使用频率高的相关课程。引导用户点击得到想要的结果

 

8、用户分群模型

分群是对某一特征用户的划分和归组,而分层,更多的是对全量用户的一个管理手段,细分用户的方法其实我们一直在用,比如我们熟悉的RFM模型:

RFM模型是从用户的业务数据中提取了三个特征维度:最近一次消费时间(Recency)、消费频率 (Frequency)、消费金额 (Monetary)。通过这三个维度将用户有效地细分为8个具有不同用户价值及应对策略的群体,如下图所示。

 

另外四个用户分群的维度:

  • 属性:用户客观的属性,描述用户真实人口属性的标签,比如:年龄、性别、城市、浏览器版本、系统版本、操作版本、渠道来源等就是用户属性
  • 活跃时间
  • 做过,没做过
  • 新增于:何时新增用户较多