R语言之实战分析

Python027

R语言之实战分析,第1张

采编自 DataMiningWithR

2.1 观察各个变量数据的规范性

几乎每个变量都有异常值存在,多是异常大值

2.2 观察变量间的相关性

2.3 双变量间的相关性

由上可知,"oPO4"和"PO4"高度相关,达到0.91

2.4 观察单个变量的数据分布情况

左图可明显判断异常值的存在,右图可展现数据在不同范围内的分布集中度

3.1 了解缺失值的基本分布情况

3.2 直接删除缺失值,在缺失值占比很少的情况采用

3.3 基于一定的规则填充缺失值

4.1 数据准备和聚类预览

初步判断,可分为4组

4.2 层次聚类

4.3 kmeans均值聚类 (1)

4.3 kmeans均值聚类 (2)

4.1 盖帽法处理异常值

即分别设定数据的上下限,高于上限的用上限替换,低于下限的用下限替换

4.2 盖帽法处理异常值后重现考察数据的分布情况

建议楼主再重新检查一下的数据集是否符合调用该函数的标准,或者检查一下参数的设定,Error in cov[-1] : object of type 'closure' is not subsettable 对象不能被取子集,大部分情况一般都是就是无法调用该对象的某个元素.cov是个向量,cov[1]是该向量第一个元素,但是在运算中出现了调用cov[-1]index都出现了错误,那一定是哪里有问题了

在NBA2k11扣篮大赛中,做出乔丹罚球线扣篮的方法:

1、使用的球员必须装备乔丹的扣篮包;

在编辑球员中,装备乔丹扣篮包即可。

2、从中线运球,一直按着加速;

3、到达三分线以内一步,马上点击投篮键;

4、这个时候就有几率出现罚球线扣篮动作。

注意:这个动作出现的几率并不高,需要多次尝试。