生成的newvar的均数为0,SD为1
数据中心化和标准化的意义是一样的,为了消除量纲对数据结构的影响。
在R语言中可以使用 scale 方法来对数据进行中心化和标准化:
scale方法中的两个参数center和scale的解释:
1.center和scale默认为真,即T或者TRUE
2.center为真表示数据中心化
3.scale为真表示数据标准化
sweep再举一个例子:
有些地方说归一化,有些地方说标准化。
prob=probabilitie是概率,df=degrees of freedom 是自由度.scale(x, center = TRUE, scale = TRUE)函数scale执行中心化和标准化.若center为数字或向量,x减去center. center=TRUE则减去x的平均值,即center=mean(x).scale=TRUE,则为x中心化后除以根方差,若scale为与x等长的向量,则x除以scale每个值。