r语言lm函数可以做非线性回归吗

Python020

r语言lm函数可以做非线性回归吗,第1张

模型拟合

对于人口模型可以采用Logistic增长函数形式,它考虑了初期的指数增长以及总资源的限制。其函数形式如下。

首先载入car包以便读取数据,然后使用nls函数进行建模,其中theta1、theta2、theta3表示三个待估计参数,start设置了参数初始值,设定trace为真以显示迭代过程。nls函数默认采用Gauss-Newton方法寻找极值,迭代过程中第一列为RSS值,后面三列是各参数估计值。然后用summary返回回归结果。

library(car)

pop.mod1 <- nls(population ~ theta1/(1+exp(-(theta2+theta3*year))),start=list(theta1 = 400, theta2 = -49, theta3 = 0.025), data=USPop, trace=T)

summary(pop.mod)

在上面的回归过程中我们直接指定参数初始值,另一种方法是采用搜索策略,首先确定参数取值范围,然后利用nls2包的暴力方法来得到最优参数。但这种方法相当费时。

还有一种更为简便的方法就是采用内置自启动模型(self-starting Models),此时我们只需要指定函数形式,而不需要指定参数初始值。本例的logistic函数所对应的selfstarting函数名为SSlogis

pop.mod2 <- nls(population ~ SSlogis(year,phi1,phi2,phi3),data=USPop)

二、判断拟合效果

非线性回归模型建立后需要判断拟合效果,因为有时候参数最优化过程会捕捉到局部极值点而非全局极值点。最直观的方法是在原始数据点上绘制拟合曲线。

library(ggplot2)

p <- ggplot(USPop,aes(year, population))

举个例子:

一般人在身高相等的情况下,血压收缩压Y与体重X1和年龄X2有关,抽取13组成年人数据(如下图),构建Y与X1、X2的线性回归关系。

1.先创建一个数据框blood:

  blood<-data.frame(

     X1=c(76,91.5,85.5,82.5,79,80.5,74.5,79,85,76.5,82,95,92.5),

    X2=c(50,20,20,30,30,50,60,50,40,55,40,40,20),

     Y=c(120,141,124,126,117,125,123,125,132,123,132,155,147)

                                )

2.拟合线性回归:

  lm.sol<-lm(Y~X1+X2,data=blood)

  提取模型计算结果

  summary(lm.sol)

这里说一下含义:

1、在计算结果的第一部分(call)列出了相应的回归模型公式;

2、第二部分(Residuals)列出了残差的最小值点、1/4分位点、3/4分位点、最大值点;

3、第三方部分(Coefficients)Estimate表示回归方程参数的估计,std.Error表示回归参数的标准差,t value 为t值,Pr(>|t|)表示p值

说明一下:***表示极为显著,**表示高度显著,*表示显著,.表示不太显著,没有记号表示不显著

4、第四部分(Residual standard error)表示残差的标准差,(F-statistic)表示F的统计量

通过上面的结果可以看出回归模型:Y=2.13656X1+0.40022X2-62.96336

我们根据得出的回归模型进行预测

例如:预测体重X1=100,年龄X2=40的血压值Y

newdata<-data.frame(X1=100,X2=40)

pre<-predict(lm.sol,newdata,interval="prediction",level=0.95)

pre

从结果可以预测值Y166.7011和预测值Y的区间[157.2417,176,1605]