R语言绘制相关系数图||线面组合

Python016

R语言绘制相关系数图||线面组合,第1张

是不是看到这种图心里痒痒的,三年了,终于有人把它重现出来了。

从原图我们很容易发现,主要有三部分:右上角是类似于corrplot包中的上三角相关系数图;下三角是一组点之间的连接线(作者用了弧线,直线也能达到同样的效果);剩余部分主要是图例等其它辅助绘图元素。

R语言才是最好的拼图软件,只要你愿意花时间。时间来到这个历史节点上,就是这个图已经有人做出来了,而且,以你残缺的R基础也已经重新在自己电脑上重新绘制出来(尽管是在单身的学长的帮助下)。那么,这个图里面的点线面及其颜色各代表什么实际的生物学或者社会学的意义,它在讲诉一个怎样的故事?花瓶型还是内涵型?

核心函数:segments。

图例框框

这张图不过是相关系数的展现形式的一种创新,炫的地方在与下面的几条线。那么,我们不禁要问,这种形式的图和pheatmap按照p值标签的图有什么本质的区别吗?

R语言之照猫画虎2

1、洛伦兹曲线

洛伦兹曲线(Lorenz curve),也译为“劳伦兹曲线”。指在一个总体(国家、地区)内,以“最贫穷的人口计算起一直到最富有人口”的人口百分比对应各个人口百分比的收入百分比的点组成的曲线。

为了研究国民收入在国民之间的分配问题,美国统计学家M.O.洛伦兹(Max Otto Lorenz,1876- 1959)1907年提出了著名的洛伦兹曲线。

洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。通过洛伦兹曲线,可以直观地看到一个国家收入分配平等或不平等的状况。

洛伦兹曲线的弯曲程度有重要意义。一般来讲,它反映了收入分配的不平等程度。弯曲程度越大,收入分配越不平等,反之亦然。

2、基尼系数

基尼系数是指国际上通用的、用以衡量一个国家或地区居民收入差距的常用指标,最早由意大利统计与社会学家Corrado Gini在1912年提出。

基尼系数最大为“1”,最小等于“0”。基尼系数越接近0表明收入分配越是趋向平等。国际惯例把0.2以下视为收入绝对平均,0.2-0.3视为收入比较平均;0.3-0.4视为收入相对合理;0.4-0.5视为收入差距较大,当基尼系数达到0.5以上时,则表示收入悬殊。

国内不少学者对基尼系数的具体计算方法作了探索,提出了十多个不同的计算公式。山西农业大学经贸学院张建华先生提出了一个简便易用的公式:

假定一定数量的人口按收入由低到高顺序排队,分为人数相等的n组,从第1组到第i组人口累计收入占全部人口总收入的比重为wi,则说明:该公式是利用定积分的定义将对洛伦茨曲线的积分分成n个等高梯形的面积之和得到的。

3、我国的基尼系数偏大,说明我国的收入差距仍然过大,贫富差距较大,尚未达到理想的平均水平。

扩展资料

洛伦兹曲线和基尼系数的关系是:

将洛伦兹曲线与45度线之间的部分(A)叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线与45度线之间的面积(A+B)叫做“完全不平等面积”。不平等面积与完全不平等面积之比,就是基尼系数,是衡量一国贫富差距的标准。

因此 ,基尼系数也可以通过洛伦兹曲线的作图和积分求解,公式为G=A/(A+B)。从公式上推断,基尼系数不会大于1,也不会小于零。

参考资料来源:百度百科-基尼系数

参考资料来源:百度百科-洛伦兹曲线