怎么查看一个程序在R语言中的运算次数,运算时间

Python011

怎么查看一个程序在R语言中的运算次数,运算时间,第1张

下面的工具是可用的:

1. 最简单的 system.time(...)

2. microbenchmark:对比不同表达式的多次重复运行时间

3. 运行时间与内存效率监测,这有我的样例代码,learnR/b6.profiling.R at master · renkun-ken/learnR · GitHub,把"task/task1.R"改成你要运行的脚本文件即可,运行结束后会输出哪些代码耗时最长、占内存最大。

4. 可用Hadley的hadley/lineprof · GitHub 扩展包做监测结果的可视化输出

R语言中矩阵、向量在内存上的区别

向量

在初始创建时,系统就给分配了足够的空间,没有赋值的下标对应的值都用NA代替了,所以向量不存在下标超出的限制比如:

>x

[1] 1 2

>length(x)

[1] 2

>x[100]

[1] NA

>length(x)

[1] 2

>x[100]=3

>length(x)

[1] 100

创建x时给了两个数字,所以长度为2。但是取值x[100]时显示的是NA并非下标越界,当赋值x[100]=3时,x的长度变为了100。

这种性质的好处就是可以取代向量的重新赋值语句比如:

>x<- c(x,2)

可以使用以下语句代替:

>x[length(x)+1]=2

这样的好处就是由于不用重新赋值,不需要重新分配内存,因此可以大大提升程序的效率,比如:

>create_vector2<-function(k)

+ {

+ gh=c()

+ for(i in 1:k){

+ gh=c(gh,i)

+ }

+ return(gh)

+ }

>create_vector1<-function(k)

+ {

+ gh=c()

+ gh[1:k]=1:k

+ return(gh)

+ }

以上为两个创建向量的函数,运行时间测量如下:

>system.time(create_vector1(10000)) #创建10000长度的向量,函数1运行时间

用户 系统 流逝

000

>system.time(create_vector2(10000)) #创建10000长度的向量,函数2运行时间

用户 系统 流逝

0.11 0.00 0.11

>system.time(create_vector1(100000)) #创建100000长度的向量,函数1运行时间

用户 系统 流逝

000

>system.time(create_vector2(100000)) #创建100000长度的向量,函数1运行时间

用户 系统 流逝

11.48 0.01 11.71

可以看到函数1明显比函数2快很多。函数1的运行时间基本为0。

矩阵

矩阵并没有这种性质,矩阵的内存空间是初始创建空间的大小。一但确定,只有通过重新赋值来改变。所以会出现下标越界等错误。