如下:
数据集a有变量:x1,x2,x3等等
求各变量的均值方差,代码如下:
mean(a$x1) var(a$x1)。
mean(a$x2) var(a$x2)。
mean(a$x3) var(a$x3)。
……
如果有无效值,需要在括号内加入na.rm=T。
R是用于统计分析、绘图的语言和操作环境。
R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
R可以看作贝尔实验室(AT&T BellLaboratories)的Rick Becker、John Chambers和Allan Wilks开发的S语言的一种实现。当然,S语言也是S-Plus的基础。
所以,两者在程序语法上可以说是几乎一样的,可能只是在函数方面有细微差别,程序十分容易地就能移植到一程序中,而很多一的程序只要稍加修改也能运用于R。
formula代表拟合的公式,如Y~X,则对因变量Y和自变量X作线性拟合拟合模型为 y=a+bx ,如Y 0+X或Y X+0则除对因变量Y和自变量X作线性拟合外,还规定改直线必过原点及拟合模型为 y=x 。
lm对象即lm函数返回的值,其属性包括
常用的有 coefficients , residuals 和 fitted.values ,分别表示拟合的得到的各系数的值、残差和预测值。
可以看出该拟合曲线为y=0.52805925 -0.02797779x
其他值的调用,包括p值,给定x预测的y值,拟合系数R方等需要通过summary函数调用
也可以直接通过 summary(line.model) 打印出大部分与回归直线相关的一些结果
方法/步骤
1、首先,先教大家如何使用SPSS多元线性回归分析
2、接下来是范例说明:
此案例是希望找到与营收相关的多元回归式
原先加入参数有:5个
调整後回归R方:0.888 / 显着性:皆小於0.05
看起来相当拟合,无任何差错
3、可依个人需求,勾选需要参考的指标
若是没有勾选,只会出现既定标准的指标
在此需加入 Statistisc中的 "共线性诊断"
4、排除共线性强因子,可用偏相关查看是否确实应该排除
主要是看 VIF值是否大於2 (大於2,表示共线性极强需改善)
否则会有交互作用
5、最後模型拟合程度,可在excel中
做主次座标清楚检视