1、x排序
2、求线性回归方程并赋予一个新变量
z=lm(y~x+I(x^2)+...)
3、plot(x,y)#做y对x的散点图
4、lines(x,fitted(z))#添加拟合值对x的散点图并连线
曲线拟合:(nls)
lm是将曲线直线化再做回归,nls是直接拟合曲线。
需要三个条件:曲线方程、数据位置、系数的估计值。
如果曲线方程比较复杂,可以先命名一个自定义函数。
例:
f=function(x1, x2, a, b) {a+x1+x2^b}
result=nls(x$y~f(x$x1, x$x2, a, b), data=x, start=list(a=1, b=2))
#x可以是数据框或列表,但不能是矩阵
#对系数的估计要尽量接近真实值,如果相差太远会报错:“奇异梯度”
summary(result) #结果包含对系数的估计和p值
根据估计的系数直接在散点图上使用lines加曲线即可。
曲线拟合:(局部回归)
lowess(x, y=NULL, f = 2/3, iter = 3)
#可以只包含x,也可使用x、y两个变量
#f为窗宽参数,越大越平滑
#iter为迭代次数,越大计算越慢
loess(y~x, data, span=0.75, degree=2)
#data为包含x、y的数据集;span为窗宽参数
#degree默认为二次回归
#该方法计算1000个数据点约占10M内存
举例:
x=seq(0, 10, 0.1)y=sin(x)+rnorm(101)#x的值必须排序
plot(x,y) #做散点图
lines(lowess(x,y)) #利用lowess做回归曲线
lines(x,predict(loess(y~x))) #利用loess做回归曲线,predict是取回归预测值
z=loess(y~x)lines(x, z$fit) #利用loess做回归曲线的另一种做法
新年好!运用二阶导数求极值的步骤:1、先求一阶导数,令一阶导数等于0,解出来的点,可能就是极值点。 这样的点,称为 stationary point,汉语翻译成驻点;2、再求二阶导数,将驻点的坐标代入到二阶导数的表达式。 如果大于0,将驻点坐标代入原来的函数,得到的就是最小值; 如果小于0,将驻点坐标代入原来的函数,得到的就是最大值; 如果二阶导数,是一个大于0的常数, 将驻点坐标代入原来的函数,得到的就是最小值; (如 x2、2x2、3x2、4x2、、、、) 如果二阶导数,是一个小于0的常数, 将驻点坐标代入原来的函数,得到的就是最大值; (如 -x2、-2x2、-3x2、-4x2、、、、)为了具体说明,距离如下,下面的例子是求最大值跟最小值的乘积是多少?向左转|向右转R语言常用数学函数sum()、max()、min()、mean()、median()
prod(x) 对x中的元素都连乘
which.max(x) 返回x中最大元素的下标
which.min(x) 返回x中最小元素的下标
range(x) 值域
rev(x) 对x中的元素取逆序
sort(x) 将x中的元素将升序排列
pmin(x,y) 返回一个向量,它的第i个元素是x[i],y[i] 中最小值
pmax(x,y) 返回一个向量,它的第i个元素是x[i],y[i] 中最大值
cumsum(x) 求累积和,返回一个向量,第i个元素等于x[1]到x[i]的和
cumprod(x) 求累积(从左到右)乘积
cummin(x) 求累积最小值(从左到右)
cummax(x) 求累积最大值(从左到右)
match(x,y) 返回一个和x的长度相同的向量,第i个元素表示y中与x[i]相同的元素的位置(没有则返回NA)
na.omit(x) 函数忽略有缺失值(NA)的观察数据(如果x是矩阵或数据框则忽略相应的行)
na.fail(x) 如果x包含至少一个NA则返回一个错误消息
which() 返回符合条件的元素的下标
choose 组合数,二项式,例choose(4,2) 返回6
rep(x,y) 将x重复y次
unique(x) 去掉重复的元素,只取一个
table(x) 返回一个列表,给出y中重复元素的个数列表
subset(x,条件) 返回x中满足特定条件的子集