【R语言】--- 直方图

Python012

【R语言】--- 直方图,第1张

直方图(Histogram),又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹或线段组成,表示数据分布的情况。 一般用横轴(X轴)表示数据类型,纵轴(Y轴)表示分布(相应值的频数)情况。

绘制直方图,首先要对数据进行分组,然后统计每个分组内数据元的数量。 在平面直角坐标系中,横轴标出每个组的端点,纵轴表示频数,每个矩形的高代表对应的频数,称这样的统计图为频数分布直方图。一般要了解以下几个名词的概念:

组数:统计数据时,把数据按照不同的范围分成几个组,分成组的个数称为组数;

组距:每一组两个端点的差;

频数:分组内的数据元的数量除以组距;

1、显示各组频数或者数量分布情况;

2、显示各组间频数或数量的差异;

可以利用hist()函数进行绘制:

[1] Robert I. Kabacoff (著). R语言实战(高涛/肖楠/陈钢 译). 北京: 人民邮电出版社.

[2] https://www.cnblogs.com/xudongliang/p/6913363.html

[3] https://zhuanlan.zhihu.com/p/259835459

在绘制直方图时,大家可以使用hist(x)这个函数,其中x就是需要进行可视化的数据,当然这个函数还有一个参数就是freq,其默认设置是freq=NULL。当freq=FALSE时,其纵坐标是以概率的形式呈现,而freq=TRUE时则是频率作为纵坐标。另外参数breaks可以用来控制直方条之间的间隔,例如breaks=5就表示绘制出5个直方条。当然除此之外,hist()函数还有其它参数,大家可以使用?hist()来了解不同参数的作用及其使用方法。