基于R语言的数据标准化处理脚本

2023-03-05 17:23:02Python016

基于R语言的数据标准化处理脚本,第1张

基于R语言的数据标准化处理脚本

数据标准化（Normalization）

将数据按比例缩放，使之落入一个小的特定区间。去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。

数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。

数据同趋化处理主要解决不同性质数据问题，对不同性质指标直接加总不能正确反映不同作用力的综合结果，须先考虑改变逆指标数据性质，使所有指标对测评方案的作用力同趋化，再加总才能得出正确结果。

数据无量纲化处理主要解决数据的可比性。数据标准化的方法有很多种，常用的有“最小—最大标准化”、“Z-score标准化”和“按小数定标标准化”等。经过上述标准化处理，原始数据均转换为无量纲化指标测评值，即各指标值都处于同一个数量级别上，可以进行综合测评分析。

min-max标准化（Min-max normalization）

也叫离差标准化，是对原始数据的线性变换，使结果落在[0,1]区间，转换函数如下：

正向指标：（x-min）/（max-min）

负向指标：（max-x）/（max-min）

其中max为样本数据的最大值，min为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时，可能导致max和min的变化，需要重新定义。

R语言实现

# 标准化处理

min.max.norm <- function(x){

((x-min(x))/(max(x)-min(x)))

} #正向指标

max.min.norm <- function(x){

((max(x)-x)/(max(x)-min(x)))

} #负向指标

data_1 <- apply(data[,-c(3,4)],2,min.max.norm) #正向指标处理

data_2 <- apply(data[,c(3,4)],2,max.min.norm) #负向指标处理

#注意array只能用在二维及以上

data_t <- cbind(data_1,data_2)

先选取一个随机数发生器。

随机数组合的方法：选取一个随机数发生器，生成1000个随机数，令这100个随机数生成数组并命名为t。同时令n=1，命名最终需要的随机数数组为x，选取第二个发生器，生成一个随机数j，且满足1而随机数组合的难点在于，步骤2步骤3的时候随机数种子的选取比较难。这里用的是第一个随机数发生器生成的随机数作为种子，也自己定义其他的种子。

随机数数据指标量纲发生器

# 上一篇：在js中进行字符串拼接。

# 下一篇：c语言中的赋值问题，，，m＝n和n＝m一样吗

给您推荐相同类型的内容：

CSS 层级
层级 Z-index 特点： 1、有定位属性的元素谁在上面，比的是Z-index值，谁的值大，谁就在上面 2、有定位属性的元素默认层级是0，如果层级一样，则后来者居上。 3、只有有定位属性的元素才有层级的概念 4、只有
电脑怎么设置开机密码
在学习工作中，一些电脑里的工作资料、私人文件、聊天记录等，相信这些东西都不愿意随便给别人看到，尤其是当你离开电脑时,别人悄悄查看了电脑不知道，这种感觉一定很难受吧!为电脑设置开机密码可以有效避免上述情况发生。可是，电脑怎么设置开机密码?接下
js 获取字符串出现的位置
将其放入一个数组，通过split函数：代码如下：结果如下：已在一个数组。通过循环查找字符串“item_2000203024”，代码如下：语句：str.indexOf；结果：扩展资料：indexOf()方法返回String对象第一次出现
R语言与统计-1：t检验与秩和检验
一般根据数据是否符合正态分布，选择合适的统计方法： T检验，亦称student t检验（Student's t test），主要用于样本含量较小（例如n&lt30），总体标准差σ未知的正态分布资料。t检验是用t分布理
CSS文字垂直居中
01先写上html代码，如图，内容很简单，就是一个div里有一段文本。02再写上div对应的样式，如图，这里只设置了div的边框和高度，宽度。03如果这里显示的话，我们看下页面，文本是不会水平居中和垂直居中的。04
电脑中的COM什么的是什么意思？
WWW,是英文World Wide Web的缩写,意思是全球资讯网,中文为”万维网”.它最早是由欧洲量子物理实验室所开发出来的多媒体资讯查询系统.现在,它已大大超出了这一范围,成为一个多元的资源中心了.使用域名查找因特网地址要比IP数字更简
显卡怎么会坏
问题一：显卡坏了会怎么样显卡常见故障诊断如下（1）显卡接触不良故障：显卡接触不良通常会引起无法开机且有报警声或系统不稳定死机等故障。造成显卡接触不良的原因主要是显卡金手指被氧化、灰尘、显卡品质差或机箱挡板问题等。对于金手指
ruby文件夹操作
一、新建文件 f=File.new(File.join("C:","Test.txt"), "w+") f.puts("I am Jack") f.
宝马3系宝马行车电脑油耗和车载电脑油耗啥意思？
比如我行车电脑重置了影响我车载电脑的油耗的平均吗？今天跑了趟高速行车电脑油耗下来了，但是车载电脑还是那样。不太理解，求解释。谢谢比如我行车电脑重置了影响我车载电脑的油耗的平均吗？今天跑了趟高速行车电脑油耗下来了，但是车载电脑还是那样。不太理
电脑如何设置为USB启动？
电脑这样设置为USB启动：1、首先，重新启动自己的电脑，在自己的电脑进入加载操作系统之前，不断的按下F12键，就可以进入setup界面，会显示出当前电脑所拥有的启动项。2、按下enter键，进入BIOS配置。3、使用左右键，移动到boot
Golang 的静态编译
Go 语言和 C 语言的一个很大的区别是， Go 语言只静态编译，做个测试：一方面是 Go 语言编译后的可执行文件大小比 C 语言的大很多，另一方面是 C 语言的可执行文件需要依赖 glibc 动态库，用 ldd 命令可以
闭包是什么，有什么特性，对页面有什么影响
闭包是可以包含自由（未绑定到特定对象）变量的代码块；这些变量不是在这个代码块内或者任何全局上下文中定义的，而是在定义代码块的环境中定义（局部变量）。“闭包” 一词来源于以下两者的结合：要执行的代码块（由于自由变量被包含在代码块中，这些自由变
电脑主板12v电压过高
一般是电源的问题，可能是5V过载了，可以采取如下措施：1、开机直接去bios观察电压，不要使用第三方软件。2、若bios电压依然12v闪红色，关机后断掉总电源，将主板的bios电池取下来放置20秒再接回去，将主板的24pin和cpu 4
笔记本电脑什么硬盘好
问题一：笔记本电脑硬盘多大的最好？笔记本电脑的硬盘可以说是笔记本电脑中发展最慢的部件，长期以来速度都没有质的飞跃，目前普遍采用的还是4200转的规格，5400转的开始在一些高端型号的笔记本产品中出现，7200转的笔记本硬盘虽然已经发布，
如何用css控制浏览器滚动条
用CSS控制滚动条样式1,Overflow内容溢出时的设置overflow 水平及垂直方向内容溢出时的设置 overflow-x 水平方向内容溢出时的设置 overflow-y 垂直方向内容溢出时的设置以上三个属性设置的值为visible、
CSS初始化的代码怎么写
最耗资源的，最简单的* { padding: 0margin: 0border: 0} 选择性初始化举例（综合）body,div,dl,dt,dd,ul,ol,li,h1,h2,h3,h4,h5,h6,pre,code,legend,bu
C语言运算符优先级顺序
C语言运算符优先级顺序如下所示：自增运算符 ++ 和自减运算符 --，在作后缀运算符（如表达式 x++）时，较其用作前缀运算符（如表达式 ++x）时，具有较高的优先级。+、-、* 和 &amp运算符记号不但可以当作一元运算符（una
怎么看软件代码?
问题一：怎样查看别人做的软件的源代码（高手进）无论你学什么都不可能得到真正的源代码的，原因很简单，绝大多数的exe或者dll都是用高级语言诸如CC++delphi之类开发的，经过开发环境的编译得到计算机能够执行的二进制机器码文件ex
js里的返回值怎么获取到
1、首先，新建一个html5文件，输入初始化代码。2、新建一个h1标签，用于接收到时js中function函数的返回值。3、新建一个script标签，在标签里面新建一个function函数，函数返回值为22。4、在h1标签中也新建一个scr
Mac 安装cocoapodsrvm、ruby、gem、cocoapods之间的关系
执行完后可能有下面的问题。即执行 pod search AFNetworking 时，终端提示如下图1-1：这时需要我们执行以下命令：git clone https:mirrors.tuna.tsinghua.edu.cngitCo
js里的返回值怎么获取到
1、首先，新建一个html5文件，输入初始化代码。2、新建一个h1标签，用于接收到时js中function函数的返回值。3、新建一个script标签，在标签里面新建一个function函数，函数返回值为22。4、在h1标签中也新建一个scr
电脑密钥如何查看
在计算机界面中可以查看，具体的查看方法为：设备：华为笔记本。系统：win7。软件：计算机。版本：8.0.11。1、在电脑桌面上找到计算机应用程序，并点击打开计算机。2、在打开的计算机界面中，右键打开计算机菜单，找到属性一栏，并点击
js 获取字符串出现的位置
将其放入一个数组，通过split函数：代码如下：结果如下：已在一个数组。通过循环查找字符串“item_2000203024”，代码如下：语句：str.indexOf；结果：扩展资料：indexOf()方法返回String对象第一次出现
芭比布朗圣诞迷你炙恋唇膏套装有哪些颜色
在我们平时的日常生活中经常可以看到有很多人喜欢使用芭比布朗的化妆品，芭比布朗旗下有很多好用的化妆品，口碑一直很不错，芭比布朗圣诞迷你炙恋唇膏套装有很多热门色号。芭比布朗圣诞迷你炙恋唇膏套装有哪些颜色包含五款炙恋唇膏的热门色号，从上至
怎么查询企业帐号
1、在自己的电脑浏览器上百度搜索国家企业信用信息公示系统，点击进入官网。2、输入所要查询的企业名称并点击查询，比如图示的为中国银行。3、这个时候，需要找到相关的企业并点击进入。4、这样一来就可以知道统一社会信用代码了，即所要查询的企业帐号。
go是什么意思
一是一种编程语言，另一个是动词，表示走的意思。简介Go是谷歌2009年发布的第二款编程语言。2009年7月份，谷歌曾发布了Simple语言，它是用来开发Android应用的一种BASIC语言。谷歌资深软件工程师罗布·派克(Rob
怎么在word上加印章？
一、首先，在电脑上打开“Word”程序，然后打开一个文档，在图示位置插入电子印章。二、然后，在“Word”主界面上方的菜单中找到“插入”，然后选择“插入图片”点击打开。三、然后，在电脑上选择电子印章图片，然后点击打开。四、然后，插入图片后，
在电脑上怎么下载软件
方法一：1、打开电脑，点击打开浏览器。2、在搜索栏里输入你想要下载软件的名称，然后点击搜索，在搜索结果中进入到该软件的官网首页，根据提示点击下载，下载完成后根据自己电脑的空间和配置来进行安装软件。3、安装软件完成后将软件的原件删除掉就可以了
css3 实现动画效果，怎样使他无限循环动下去？
一、实现CSS3无限循环动画代码示例。代码如下：CSS:@-webkit-keyframes gogogo {0%{-webkit-transform: rotate(0deg)border:5px solid red}50
台式电脑wifi怎么弄?
台式电脑把wifi设置出来的方法：USB插到主机的USB口以后，系统就会提示发现新硬件，弹出驱动安装界面(PCI接口的内置无线网卡也是这样的，装完开机，进入系统后就会提示发现新硬件)一般不推荐自动安装，我们选择“从列表或指定位置安装(高级)

推荐阅读

热门文章

最新发布

标签列表

基于R语言的数据标准化处理脚本

给您推荐相同类型的内容：