数据分析利器之帕累托法则(二八法则)

Python024

数据分析利器之帕累托法则(二八法则),第1张

原文链接: 数据分析利器之帕累托法则(二八法则)

帕累托法则又称为二八法则,指80%的结果由其中20%的变量产生,且帕累托法则主要关注的是顶端20%变量。

帕累托法则可应用于营销运营、投资、时间管理、个人成长等诸多方面,这里我们主要讨论中营销运营中的作用。在营销运营中的作用主要有以下几个方面:

优化变量结构。如:当企业80%的利润由20%的客户产生,企业的客户是趋于稳固的;当企业80%的利润由超过20%的客户产生,则应考虑增加重点客户培育、扩大重点商户数量;当企业80%等利润由小于20%的客户产生,则企业基础客户群规模需要扩展和增加。

发现关键因素,优化投入结构。如:企业80%的利润由20%的客户产生,应对这20%客户加强重视,提升客户黏性,并进一步增加这部分客户的消费。

帕累托分析法

拍累托图是分析帕累托法则的专用图表,在帕累托图中,不同类别的数据根据其频率降序排列,并在同一张图中画出累积百分比图,从而体现出数据的绝大部分存在于很少类别中,极少剩下的数据分散在大部分类别中。

ABC分析法

拍累托法则主要将研究对象分为两类,ABC分析法(Activity Based Classification)则是对帕累托法则的应用升级,他们的重点都是 抓住主要矛盾,集中力量解决核心问题 。

ABC分析法过程与帕累托分析过程相似,首先对频率进行降序排列,然后计算累计百分比,根据分组情况将研究对象分为三类,如:50%的利润由10%的A类客户产生,这类客户为重点客户;30%的利润由10%的B类客户产生,这类客户为次重点客户;20%的利润由80%的C类客户产生,这类客户为非重点客户。

下图对相关性分析方法重点内容进行了罗列,可保存到相册随时查看。

参考文档:

https://baike.baidu.com/item/%E5%B8%95%E7%B4%AF%E6%89%98%E5%9B%BE/8735273?fr=aladdinhttps://zhuanlan.zhihu.com/p/210546766

https://zhuanlan.zhihu.com/p/136997526

往期推荐:

XGBoost(二):R语言实现

疫情下,你还好吗

R语言爬虫与文本分析

图片相似度识别:pHash算法

帕累托分布是以意大利经济学家维弗雷多·帕雷托命名的。 是从大量真实世界的现象中发现的幂次定律分布。这个分布在经济学以外,也被称为布拉德福分布。

在帕累托分布中,如果X是一个随机变量, 则X的概率分布如下面的公式所示:

<math>{\rm P}(X>x)=\left(\frac{x}{x_{\min}}\right)^{-k}</math>

其中x是任何一个大于xmin的数,xmin是X最小的可能值(正数),k是为正的参数。帕累托分布曲线族是由两个数量参数化的:xmin和k。分布密度则为

<math>p(x) = \left \{ \begin{matrix} 0, &\mbox{if }x <x_{\min}\\ \\ {k \x_{\min}^k \over x^{k+1}}, &\mbox{if }x >x_{\min}. \end{matrix} \right.</math>

帕累托分布属于连续概率分布。 “吉普夫定律”, 也称为“zeta 分布”, 也可以被认为是在离散概率分布中的帕累托分布。 一个遵守帕累托分布的随机变量的期望值为 <math>x_{\min} \k \over k-1 </math>(如果 <math>k \leq 1</math>, 期望值为无穷大) 且随机变量的标准差为 <math>{x_{\min} \over k-1} \sqrt{k \over k-2}</math>(如果 <math>k \leq 2</math>, 标准差不存在)。

被认为大致是帕累托分布的例子有:

在现代工业资本主义创造了大量中产阶级之前,财富在个人之间的分布。

甚至在现代工业资本主义创造了大量中产阶级之后,财富在个人之间的分布。

人类居住区的大小

对维基百科条目的访问

接近绝对零度时,爱因斯坦凝聚的团簇

在互联网流量中文件尺寸的分布

油田的石油储备数量

龙卷风带来的灾难的数量

这个书上应该有 - -!