R语言实用案例分析-相关系数的应用

2023-02-25 07:45:02Python020

R语言实用案例分析-相关系数的应用,第1张

R语言实用案例分析-相关系数的应用

在日常工作中，经常会存在多个变量之间存在关联关系，比如学习数学好的同学，物理成绩可能也比较高。在公司中外貌和讨人喜欢的关系往往也比较大，在人事招聘过程中，如果想要更加综合的评价某个人，需要把相关系数比较高的方面进行权重或者均值处理。

如以下案例：

现有30名应聘者来公司应聘，公司为这些应聘者制定了15项指标，分别是：求职信的形式（FL）、外貌（APP）、专业能力（AA）、讨人喜欢（LA）、自信心（SC）、洞察力（LC）、诚实（HON）、推销能力（SMS）、经验（EXP）、驾驶水平(DRV）、事业心（AMB）、理解能力（POT）、交际能力（KJ）和适应性（SUIT）。每项分数是从0到10分，0分最低，10分最高。每位求职者的15项指标如下所示，公司计划只录取前5名申请者，公司到底该如何选择呢？

#读入数据

rt<-read.table("applicant.data")

AVG<-apply(rt,1,mean)

sort(AVG,descreasing=TRUE)

attach(rt)

#找到相关系数高的分为一组，然后取平均值，防止值过大

rt$G1<-(SC+LC+SMS+DRV+AMB+GSP+POT)/7

rt$G2<-(FL+EXP+SUIT)/3

rt$G3<-(LA+HON+KJ)/3

rt$G4<-AA

rt$G5<-APP

AVG<-apply(rt[,16:20], 1, mean)

sort(AVG, decreasing = TRUE)

找出前5名

采编自 DataMiningWithR

2.1 观察各个变量数据的规范性

几乎每个变量都有异常值存在，多是异常大值

2.2 观察变量间的相关性

2.3 双变量间的相关性

由上可知，"oPO4"和"PO4"高度相关，达到0.91

2.4 观察单个变量的数据分布情况

左图可明显判断异常值的存在，右图可展现数据在不同范围内的分布集中度

3.1 了解缺失值的基本分布情况

3.2 直接删除缺失值，在缺失值占比很少的情况采用

3.3 基于一定的规则填充缺失值

4.1 数据准备和聚类预览

初步判断，可分为4组

4.2 层次聚类

4.3 kmeans均值聚类 (1)

4.3 kmeans均值聚类 (2)

4.1 盖帽法处理异常值

即分别设定数据的上下限，高于上限的用上限替换，低于下限的用下限替换

4.2 盖帽法处理异常值后重现考察数据的分布情况

变量数据系数缺失异常

# 上一篇：c语言如何判断奇偶数？

# 下一篇：Go 是怎么使用 Go 来编译自身的

给您推荐相同类型的内容：

Go微服务--常见的微服务框架
近几年诞生了很多微服务框架，比如JAVA的Spring Cloud、DubboGolang的GoKit和GoMicro以及NodeJs的Seneca。几乎每种主流语言都有其对应的微服务框架。 Go在微服务框架中有其独特的优势，至于优势在
java设计银行怎么某年交易记录
用于保存用户每次的交易记录。每次存款或取款成功后，将该次的交易记录(交易时间和交易金额)写进文件中。交易时间调用 Java.util包下的Date类获取正确的交易时间。查询交易记录：将交易记录文件中的信息读取出...在后台查询出结果后，
电脑编程c语言入门概括哪些？
1:工欲善其事，必先利其器 x0dx0ax0dx0a这里介绍几个学习C语言必备的东东： x0dx0ax0dx0a一个研发环境，例如turbo C 2.0,这个曾占据了DOS时代研发程式的大半个江山。但是现在windows时代
python和go语言哪个好
Python是什么呢?Python是一个功能强大的高级编程语言，主要用于科学和工程计算，是一种高效的编程语言，布局简洁而强大，适合新手以及专业人士学习。Go是什么呢?Go是一种通用编程语言，由Google设计，借鉴了许多其他有好主意的语言，
Go 是怎么使用 Go 来编译自身的
Go是一个图灵完备的语言任何图灵完备的语言理论上都可以用来编译自身。比如cc++, java, vb, php等等都可以。至于怎么编译自身的：用其它语言比如c++实现一个[Go语言编译器-1]用Go语言写一个[Go语言编译器-2]用
连续性函数期望公式
连续函数求期望的公式：E（X^2）=D（X）+（E（X））^2=1+0^2=1。若X~N（1，3），则Dx=3，由DX=EX^2-（EX）^2及EX的值可以算出EX^2。若X~N（1，3），Y=3X+1，EY=E（3X+1）=3EX+1=
目标跟踪（5）使用 Opencv 和 Python 进行对象跟踪
在本教程中，我们将学习如何基于 Opencv 和 Python 实现对象跟踪。首先必须明确目标检测和目标跟踪有什么区别：我们将首先讨论对象检测，然后讨论如何将对象跟踪应用于检测。可能有不同的应用，例如，计算某个区域有多少
c语言如何把2010.05.06输出
C语言通过输入十个整数然后分别顺序和逆序输出的编程思想和方法如下：1.首先需要定义一个整型数组用于存储输入的10个整数。这里定义一个数组a。2.然后利用for循环，接受从键盘输入的10个整数。这里使用i作为循环的游标变量。3.输入完毕后，再
德阳农业科技职业学院招生专业目录及有哪些院系(参考)
一、德阳农业科技职业学院招生专业目录表医护学院宠物临床诊疗技术（宠物医疗与保健）宠物临床诊疗技术（宠物医学与美容）宠物临床诊疗技术（宠物临床医学）护理学护理（涉外护理）现代农业学院现代农业技术（抗癌中草药种
Go lang制作一个简单的区块链
区块链是一种数据存储的结构，通过GO语言可以方便的创建一个区块链直接上代码1：区块接口和方法 2：创建区块链类和方法最后测试方法：测试结果： PS F:goblock&gtgo run
韩剧ruby放屁是哪部韩剧
红宝石的爱。韩剧ruby放屁是红宝石的爱这部韩剧。讲述了患有社交恐惧症的女主人公李Ruby偶然获得了“魔法的戒指”的帮助，并成为了珠宝设计师的故事。故事很简单，有些奇幻色彩的励志爱情剧，而且做为行业背景，我颇为怀疑这是珠宝业的大型广告策划。
请问C语言中，整数都有哪些数据类型求大神解答？
C语言中，简单的内置类型有两种：整数类型和void类型(数组和指针是复合类型)。整数的数据类型有8种:unsignedchar, signedchar,shortint,unsignedshortint, int,unsignedint,l
粉红色英语怎么说?
问题一：粉红色的用英语怎么写粉红色是 pink 下面是常用的一些表示颜色的英文，顺便学习了解下： red（红）， white（白），black（黑），green（绿），yellow（黄），blue（蓝），purple（紫），gr
能不能用R软件填补缺失数据？
各位大神，谁能给提点一下怎么在R语言中实现缺失值的处理，不是简单地删除，而是用其他的方法进行填补，数据集为一excel数据，大约1000条数据的样子。求问啊，再网上找了下，把网上的方法粘在这里吧，不过貌似不太对，用不了。求问各路大仙还有没有
归因危险度中的le和l0分别是是什么
归因危险度计算公式：AR% =（Ie-I0）Ie×100%是指暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。意义该指标反映某因素的暴露者中，单纯由于该因素引起发病的危险占整个病因的比例。二、相对危险度计算公式RR=暴露组
python入门实例教程
python入门实例教程！步骤1：这里我将简单告诉大家一个用python软件编写的一个关于货物售价折扣方面的一个计算程序，首先打开python软件。步骤2：进入python后，会出现如图所示界面，按照图中箭头指示，先选择File选项，然后在
java招聘为啥要hr
先技术面试后人事面试。因为是该公司岗位对求职者有一定的技术要求，只有在技术面试通过后，才可以进入人事面试，所以java招聘要hr。Java，是由Sun Microsystems公司于1995年5月推出的Java程序设计语言和Java平台的总
python最擅长哪个方面
Python的应用领域很广，可以做自动化测试，自动化运维,也可以做web后端开发(比如大名鼎鼎的Django,Flask等框架)，也可以做爬虫，数据分析，更可以做机器学习，自然语言处理，数据挖掘，有很多领域。你到底要学什么，很容易迷失方向，
有了解GUILD证书的吗？想问下是哪里的实验室出具的，求详解
美国GUILD宝石实验室，由国际知名宝石学家Mr. Charles Carmona创立于1980年，总部位于美国洛杉矶。至今，已在美国洛杉矶、中国深圳、广州、泰国曼谷等国际级宝石交易市场开设仪器完善、检测专业、服务细致的宝石实验室。自成立
java资料，百度文库
获取方式：关注公众号 hot_learning，并在公众号中，可以免费获取基础资料哦。加入圈子可以免费获得所有资料，出来JAVA资料，更多资料尽待发现哦。现在来看看都有关于JAVA的资料吧：JAVA基础：常用语法。线程与输入流。面向
Ruby VS JAVA 到底谁比谁更强？（1）
他的顾问公司专注于Java 持久化框架和轻量级开发方法，同时他也是这些流行的Java图书的作者， Spring: A Developer's Notebook, Better, Faster, Lighter Java, 以及 B
Python 多键对一值的问题
如果你学过java，那么可以利用hashmap的原理，当hash值碰撞时，将节点转为链表或者树结构，同理，python里面给你提供思路。第一步，生成所有排列作为list对象,假定命名为all_list第二步，让所有的Key都返回这个li
c语言四种基本数据类型
C语言四种基本数据类型：整型，浮点型，指针，聚合类型（数组和结构体）。浮点型：浮点型包括单精度型和双精度型。（1）单精度型：一般占4个字节（32位），float a=4.5。（2）双精度型：一般占8个字节（64位），double
R语言之字符串的组合与拆分
由以上可知， paste() 默认连接符为空格， paste0() 连接符为空，等于 paste(sep = '')由以上可知，当被组合对象元素个数不相等时，会依次选取元素组合，最终的组合数等于元素个数多的那个
R语言在图像上添加参考线
1.打开Excel后，新建一个数据表，然后点击【插入】面板上的图表图标，生成一个柱形图。2..添加横向参考线有两种方法，第一种是直接绘制线条来添加。点击选中图表，然后点击插入菜单中的形状下的线条图形，按住键盘Shift键，按住鼠标左键拖拉绘
if语句的用法c语言是什么？
c语言提供了三种形式的if语句：1、if（表达式）语句。例如：if（x&gty）printf("%d",x)此时，如果表达式为真，则执行printf语句。2、if（表达式）语句1 else 语句2例如：
r语言mean(x[c1])什么意思
求算术平均值。R语言，一种自由软件编程语言与操作环境，主要用于统计分析、绘图、数据挖掘。r语言mean(x[c1])的意思是求算术平均值。meanR语言中的函数用于计算作为参数传递给它的数字向量元素的算术平均值。Mean（）求平均值通过求
java插入数据库报错如何跳过
java插入数据库报错跳过参考以下方法解决在my.cnf的[mysqld]片段中加入设置innodb_autoinc_lock_mode=0同一时候注意调大jdbc的活跃链接数，如设置 jdbc.maxActive=300，由于设置inno
怎么写C语言条件判断if语句
我们用C语言的时候，最经常使用的就是IF语句了，那么如何写C语言的IF语句呢？下面我给大家分享一下。工具材料Visual Studio 2015 01首先打开Visual Studio 2015软件，新建一个Win32控制台
C语言中的“--”的用法
1、左移运算符（&lt&lt）：按二进制形式把所有的数字向左移动对应的位数，高位移出(舍弃)，低位的空位补零。格式：需要移位的数字 &lt&lt移位的次数例如：3&lt&lt23转换为二

推荐阅读

热门文章

最新发布

标签列表

R语言实用案例分析-相关系数的应用

给您推荐相同类型的内容：