公众号的读者留言问答的问题,首先他的数据集如下
1 这个是数据集按行求平均
2 这个是数据集中按行求标准差
3 这个公式的计算方法是先按照行求平均值得到一个向量a,按行求标准差得到一个向量b,最后是按照列来进行abs(x-a)/b
4 这个公式就是把3得到的新数据集按照行求和然后再除以数据的维度
readxl 包用来读取数据
tidyverse 用来操作数据
readxl 中的 read_excle() 函数好像没有指定某一列作为行名的函数,所以我给原始数据添加一个表头
读取数据
小明的数据分析笔记本
第一步,定义一个向量sales,并利用数值类型给sales赋值,然后打印sales,如下图所示:
请点击输入图片描述
第二步,再定义一个向量num,利用整数类型向量赋值给num,并打印num,如下图所示:
请点击输入图片描述
第三步,分别利用sd()函数获取sales和num的标准差,如下图所示:
请点击输入图片描述
请点击输入图片描述
第四步,由于sales里的元素比较复杂,需要对其进行求平均值,可以利用mean函数,如下图所示:
请点击输入图片描述
第五步,如果想查看num和sales两者的相关度,利用cor()函数实现,如下图所示:
请点击输入图片描述
第六步,如果想查看num和sales的关系,并且以图形的形式展示出来,使用plot函数,如下图所示:
请点击输入图片描述