绘制直方图,首先要对数据进行分组,然后统计每个分组内数据元的数量。 在平面直角坐标系中,横轴标出每个组的端点,纵轴表示频数,每个矩形的高代表对应的频数,称这样的统计图为频数分布直方图。一般要了解以下几个名词的概念:
组数:统计数据时,把数据按照不同的范围分成几个组,分成组的个数称为组数;
组距:每一组两个端点的差;
频数:分组内的数据元的数量除以组距;
1、显示各组频数或者数量分布情况;
2、显示各组间频数或数量的差异;
可以利用hist()函数进行绘制:
[1] Robert I. Kabacoff (著). R语言实战(高涛/肖楠/陈钢 译). 北京: 人民邮电出版社.
[2] https://www.cnblogs.com/xudongliang/p/6913363.html
[3] https://zhuanlan.zhihu.com/p/259835459
准备工具:(1)电脑
(2)需自行安装R及Rstudio(#我们只要在Rstudio中练习,其中的作用你上手即可知道)
ok,开始我们的学习
第一步:导入我们的数据(或先在文本中如数几个数据进行练习)
data
#自行输入代码
第二步:开始制图(我们后面的练习都用上述数据)
1、用于绘制直方图的数据,该参数的值为一个向量
data
hist(data)
#从图中可以看出,横坐标为不同的区间,纵坐标落入该区间的频数
2、break参数使用
#指定一个向量,给出不同的断点
data
hist(data, breaks = c(0.5, 1.5, 2.5, 3.5))
3、freq:逻辑值,默认值为TRUE,y轴显示的每个区间内的频数,FALSE:代表显示的是频率
#4)probability:逻辑值和freq参数的作用正好相反,TRUE代表频数,TALSEd代表频数
par(mfrow = c(1,2))
data
hist(data, breaks = c(0.5, 1.5, 2.5, 3.5), probability = T, main = "probability = T")
hist(data, breaks = c(0.5, 1.5, 2.5, 3.5), probability = F, main = "probability = F")
###最重要的地方
##labels:显示在每个柱子上方的标签(可以用做方差标记)
hist(data, breaks = c(0.5, 1.5,2.5, 3.5), labels = c("A