【R语言】--- 直方图

Python019

【R语言】--- 直方图,第1张

直方图(Histogram),又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹或线段组成,表示数据分布的情况。 一般用横轴(X轴)表示数据类型,纵轴(Y轴)表示分布(相应值的频数)情况。

绘制直方图,首先要对数据进行分组,然后统计每个分组内数据元的数量。 在平面直角坐标系中,横轴标出每个组的端点,纵轴表示频数,每个矩形的高代表对应的频数,称这样的统计图为频数分布直方图。一般要了解以下几个名词的概念:

组数:统计数据时,把数据按照不同的范围分成几个组,分成组的个数称为组数;

组距:每一组两个端点的差;

频数:分组内的数据元的数量除以组距;

1、显示各组频数或者数量分布情况;

2、显示各组间频数或数量的差异;

可以利用hist()函数进行绘制:

[1] Robert I. Kabacoff (著). R语言实战(高涛/肖楠/陈钢 译). 北京: 人民邮电出版社.

[2] https://www.cnblogs.com/xudongliang/p/6913363.html

[3] https://zhuanlan.zhihu.com/p/259835459

准备工具:

(1)电脑

(2)需自行安装R及Rstudio(#我们只要在Rstudio中练习,其中的作用你上手即可知道)

ok,开始我们的学习

第一步:导入我们的数据(或先在文本中如数几个数据进行练习)

data

#自行输入代码

第二步:开始制图(我们后面的练习都用上述数据)

1、用于绘制直方图的数据,该参数的值为一个向量

data

hist(data)

#从图中可以看出,横坐标为不同的区间,纵坐标落入该区间的频数

2、break参数使用

#指定一个向量,给出不同的断点

data

hist(data, breaks = c(0.5, 1.5, 2.5, 3.5))

3、freq:逻辑值,默认值为TRUE,y轴显示的每个区间内的频数,FALSE:代表显示的是频率

#4)probability:逻辑值和freq参数的作用正好相反,TRUE代表频数,TALSEd代表频数

par(mfrow = c(1,2))

data

hist(data, breaks = c(0.5, 1.5, 2.5, 3.5), probability = T, main = "probability = T")

hist(data, breaks = c(0.5, 1.5, 2.5, 3.5), probability = F, main = "probability = F")

###最重要的地方

##labels:显示在每个柱子上方的标签(可以用做方差标记)

hist(data, breaks = c(0.5, 1.5,2.5, 3.5), labels = c("A