r语言transform函数怎么用

Python08

r语言transform函数怎么用,第1张

函数主体可以是一系列表达式,这些表达式需要用大括号括起来:

function(param1, ..., paramN) {

expr1

.

.

.

exprM

}

讨论

函数的定义告诉R软件“用何种方式进行计算”。例如,R软件没有内置计算变异系数的函数,因此你可以定义函数如下:

>cv <- function(x) sd(x)/mean(x)

>cv(1:10)

[1] 0.5504819

第一行定义了名为cv的函数,第二行引用该函数,以1∶10作为其参数x的值。函数对参数应用函数主体中的表达式sd(x)/mean(x)进行计算并返回结果。

定义函数后,我们可以在任何需要函数的地方应用它,例如可以作为lapply函数的第二个参数(参见方法6.2):

>cv <- function(x) sd(x)/mean(x)

>lapply(lst, cv)

函数主体如果包含多行表达式,则需要使用大括号来确定函数内容的起始和结束位置。下面这一函数采用了欧几里德算法计算两个整数的最大公约数:

>gcd <- function(a,b) {

+ if (b == 0) return(a)

+ else return(gcd(b, a %% b))

+ }

R软件也允许使用匿名函数,匿名函数是没有函数名称但在单行的语句中很实用的函数。先前的例子中我们提到将cv函数作为lapply函数的一个参数,而若使用匿名函数直接作为lapply函数的参数,则能将原先的命令简化至同一行中:

>lapply(lst, function(x) sd(x)/mean(x))

由于本书重点不在于介绍R的编程语言,这里不对R函数编程的细微之处进行解释。下面给出几个需要注意的地方:

返回值

所有函数都有一个返回值,即函数主体最后一个表达式值。你也可以通过return(expr)命令给出函数的返回值。

值调用

函数参数是“值调用”——如果你改变了函数中的参数值,改变只是局部的,并不会影响该参数所引用的变量值。

局部变量

你可以简单地通过赋值来创建一个局部变量,函数结束后该局部变量会消失。

条件执行

R语法中包含if语句,更多详情可以使用help(Control)命令查看。

循环语句

将数据全选复制,建立新sheet,用 Ctrl+Alt+V 快捷键进行选择复制,在弹出的菜单框中勾选转置选项。

t函数 :用t()即可实现行和列的翻转

transform函数如果不想覆盖原先的值,可以这样操作,将修改后的值赋值给一个新的列名,这样原始数据可以保存下来

在R中,和排序相关的函数有三,sort,order,rank函数。

sort是对向量进行排序(只能用于向量不能用于数据框),返回结果向量,数值按从小到大排序,字符按从A到Z排序,总体来说就是按ASCAll码的顺序进行排序。若要求从大到小排序则有两种方法。

引申

要理解的是sort只能对某行或某列排序,而无法对整体进行排序,但是我们可以通过数据框索引,将索引值用sort函数,访问出的结果就会是有序的

例如将列名排序并访问

order函数也可以对向量进行排序,但是返回后的位置是向量的位置而不是结果,通过下图中rivers数据集的对比就可以知晓。

同样的,我们也可以使用order对数据框进行排序

若想按照从大到小排列,也可以以下方法

多条件排序时,第一个条件最为重要,第二个条件是为了把第一个条件下的相同值数据在第二个条件下进行排序。

logit=glm(y~x1+x2,data=data,family=binomial(link='logit')) glm表示广义线性回归,data表示y,x1,x2所在的数据集,family中的link用来选择回归类型,logit表示选择logistic回归