问卷数据的标准化

Python021

问卷数据的标准化,第1张

数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。由于信用指标体系的各个指标度量单位是不同的,为了能够将指标参与评价计算,需要对指标进行规范化处理,通过函数变换将其数值映射到某个数值区间。一般常用的有以下几种方法。

生成的newvar的均数为0,SD为1

数据中心化和标准化的意义是一样的,为了消除量纲对数据结构的影响。

在R语言中可以使用 scale 方法来对数据进行中心化和标准化:

scale方法中的两个参数center和scale的解释:

1.center和scale默认为真,即T或者TRUE

2.center为真表示数据中心化

3.scale为真表示数据标准化

sweep再举一个例子:

有些地方说归一化,有些地方说标准化。

prob=probabilitie是概率,df=degrees of freedom 是自由度.scale(x, center = TRUE, scale = TRUE)函数scale执行中心化和标准化.若center为数字或向量,x减去center. center=TRUE则减去x的平均值,即center=mean(x).scale=TRUE,则为x中心化后除以根方差,若scale为与x等长的向量,则x除以scale每个值。