020-29815005
预约专线时间:09:00-23:59

大数据资料分析的一般步骤

新闻来源:优漫教育 日期:2021-06-23
本节我们要讲讲,数据分析的一般步骤,这些步骤并不是要教你按步骤、教科书般一步一个脚印地进行数据分析,而是告诉你一种思路,当你还没有头脑的时候,可以尝试利用这一步骤帮助你找到思路。
  这些主要步骤大致分为五个步骤:

  一、认识到的问题。

  这个步骤的目的是发现核心问题。有时候,你会同时收到几个问题,在进行分析之前,先看看是不是有关联关系,相关问题要结合分析,这样才能提高效率。有时候,你接受的可能只是一种现象,你要把这一现象分解,转化为要解释的问题,才能进行下一步的分析。举例来说,有人告诉你日活数据有异常,这只是一个现象,不是问题。哪些是数据异常?还是日活降了算异常,还是日活下跌破大算异常,还是日活趋势不符合历史规律算异常?必须将现象转化为具体问题,好下一步工作。



 二,提出假设。

  这个步骤的目的是要找到检测的方向。最初阶段应尽可能将地头脑风暴与可能相关的因素结合起来,然后根据每一个因素的相关性或权重进行排序,最后收敛到几个重要因素。使用MECE规则,可以使程序相互独立,完全穷尽,寻找所有的相关要素。

  “假设说”,是一套解释模式,直言不讳地说就是逻辑成立、因素之间相互影响的逻辑链的推论。这个步骤也很关键,不能有太多的地方去检查,否则效率很低,最后也会发现多数都是死胡同,白白浪费工作量。此外,要先发散再收敛,不要一开始就根据经验确定几个点,这样就会忽略掉新的因素所带来的影响。


大数据培训班


  三,选择表征。

  有一句数据分析界广为流传的话:“一切不可量化,不可优化”。原因很简单明了,不能用数据量化,也无法评估它是否优化。

  这一阶段的目标是找出量化指标,根据数据确定问题所在。定量的方法有很多种,并且与具体的业务场景密切相关。举例来说,如果您要检查的问题是播放量下降太多,那么您提出的一个假说就是,最近电影频道没有好的内容,可能会导致用户找不到好的电影,进而导致整体播放量下降。然后,你至少选择两个指标,一是对比分析各频道节目播放量下降比例与下降绝对值,看下电影频道是否下降最显着,二是电影频道播放量与整体播放量趋势的对比,看下电影频道与整体数据趋势是否保持高度一致。

  选择指标时,也不要多多益善,尽量把最重要的指标集中在一起,避免过于分散,耗费大量人力物力。



四,收集资料。

  "巧妇难为无米之炊",有了思路没数据,也就白搭了。然而,对互联网公司而言,通常数据并不是大问题,而且在目前国内还比较开放的环境中,数据收集通常会被考虑到产品的设计阶段。但也有一点需要注意,就是不能局限于数据,有时候没有直接的数据,但可以通过一些其他指标间接达到目的,也是可以的。



  五,分析验证。

  在开始的四个步骤准备之后,这一步就可以顺水推舟了。经常使用常规数据统计方法,加上前面提到的几种数据分析方法,就可以解决大多数数据分析问题。在此需要强调的是,数据分析所得的数据和结论,必须经过验证,否则容易出错。校验方法有很多,首先可以先看一下分析结果数据,看是否有疑点,如果有,一定要找出原因;另外,还可以从其他指标方面对结论进行校验,或根据结论进行简单推导,然后再用数据验证推导结果是否正确。如果不需要更多数据,那么还有一个办法,把你的分析和推导过程告诉另一个分析者,看看是否有漏洞存在。