数据分析模式有几种?分别是什么呢?

Python013

数据分析模式有几种?分别是什么呢?,第1张

一般而言,数据分析模式有四种,描述性数据分析、诊断性数据分析、预测性数据分析、指导性数据分析。

1)描述性数据分析

在这个分类里,主要是为了搞清楚一件事,即发生了什么?当然,这也是平时工作中使用模式最为普遍的一种。

举个例子,比如你搜集了过去5年的每一季度的产品销量数据,然后经过整理,可视化。最终,你得到一个结论,最近5年来,该产品持续低迷,销量持续下滑。这就是所谓的描述性数据分析,他帮助我们描述了一件事具体是什么。

2)诊断性数据分析

描述性统计是为了知道发生了什么,而诊断性数据分析则是为了知道现象背后的原因是什么?

仍然跟着上面的例子走,当你知道该产品最近5年持续低迷,销量不断下滑这个现象之后。那么,你就应该进一步去判断,是什么样子的原因导致了这种情况。

经常使用的方法就是细分维度以及交叉维度,总之经过这样的分析之后,你得到了一个结论:由于该产品质量发生重大错误,导致销量在5年以内持续低走。

3)预测性数据分析

接下来你有点坐立不安了,你特别想知道如果不改变策略的话,下个季度或者未来更久的时间内,销量会发生什么样子的变化呢?

这个时候你就需要根据历史数据搭建一个预测模型了,然后再根据这个预测模型得到下个季度的产品销量数据以及之后更久的产品销量数据。

因此,你通过这个预测性数据分析,你知道了,是时候发生一些改变了,不然企业会垮掉的。这就是预测性数据分析的作用。

4)指导型数据分析

知道事情的严重性还不行,你还需要知道通过怎么样的办法来进行改善产品质量,从而提升产品的销量。这时候你通过调取产品线的各项抽样数据,然后进行细致的分析,你突然发现某个生产线的质量是产品质量差的关键。

因此,是时候对这个产品线进行一些处理了,不然会影响整个品牌乃至企业的。

这就是数据分析常见的四种分析模型,希望对你有所帮助。

@[toc]

原假设:该分布可以认为是正态分布(和正态分布没有差异)

p<0.5,拒绝原假设,也就是不能认为该分布是正态分布;

p>0.5,不能拒绝原假设,也就是不能否认该分布是正态分布。