绘制直方图,首先要对数据进行分组,然后统计每个分组内数据元的数量。 在平面直角坐标系中,横轴标出每个组的端点,纵轴表示频数,每个矩形的高代表对应的频数,称这样的统计图为频数分布直方图。一般要了解以下几个名词的概念:
组数:统计数据时,把数据按照不同的范围分成几个组,分成组的个数称为组数;
组距:每一组两个端点的差;
频数:分组内的数据元的数量除以组距;
1、显示各组频数或者数量分布情况;
2、显示各组间频数或数量的差异;
可以利用hist()函数进行绘制:
[1] Robert I. Kabacoff (著). R语言实战(高涛/肖楠/陈钢 译). 北京: 人民邮电出版社.
[2] https://www.cnblogs.com/xudongliang/p/6913363.html
[3] https://zhuanlan.zhihu.com/p/259835459
取直方图的每个矩形的中点,连接,把它看成是正态分布曲线,看图形的胖瘦。1、使用分组数据的方差计算方法。2、直方图上有每个组的均值和每个组的频数。假设某个组处于10-20,频数为5,那么这个组可以看成是5个15,依次类推,能获得一堆数据,算这堆数据的方差即可。3、方差=(中点-平均数)×频率的和,其中频率=各长方形面积。
可以多做些题加强巩固,总结自己的学习方法。