2、其次一直重复直到获得比较满意的拟合。
3、最后若不显著,则说明数据集中没有离群点。
#头两行是读取csv文件,逗号分隔值 comma seperated value,是一种简化的excel文件OrgData=read.csv("DownlinkPower_train.csv",header=T)
TestData=read.csv("DownlinkPower_test.csv",header=T)
#第四第五行是选取子集subset(),从 OrgData里选出 OrgData[,1] >0 第一列为正的那些行。
OrgData = subset(OrgData, OrgData[,1] >0)
TestData = subset(TestData, TestData[,1] >0)
#第六行是把data的列名字赋给OrgData_colname
OrgData_colname = colnames(OrgData)
OrgData = cbind(OrgData,1) //cbind 是合并矩阵? cbind是column bind就是横着粘在一起
竖着粘在一起是rbind,此处cbind(OrgData,1)就是在OrgData的最后加一列全是1
#重新给列命名,c()是字符串的向量,相当于给最后一列命名"intercepts"
colnames(OrgData) = c(OrgData_colname, "intercepts")
#as.matrix相当于c++的cast 强行转换格式,此处强行转换成矩阵格式
#dim(OrgData)是输出OrgData的行数和列数,[2]引用的是列,2:列数就是取OrgData中2到最后一列,其实此处可以用ncol(OrgData)来找列数
x1 = as.matrix(OrgData[,2:dim(OrgData)[2]])
#把OrgData的第一列给y1
y1 = OrgData[,1]