R语言输入命令什么在浏览器中显示帮助文档

Python012

R语言输入命令什么在浏览器中显示帮助文档,第1张

输入help获取该函数的帮助文档

R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。

与起源于贝尔实验室的S语言类似,R也是一种为统计计算和绘图而生的语言和环境,它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。但是,市面上也有许多其他流行的统计和制图软件,如Microsoft Excel、SAS、IBM SPSS、Stata以及Minitab。为何偏偏要选择R?

R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种交互式实现。它的一些主要特征是:

第一,它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。

第二,R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。

第三,R语言其实就是一种环境平台。它提供平台,而统计分析研究和计算机研究人员可以将各自通过编程形成的统计分析方法以打包(package)的方式放在R语言平台上,供一般的统计分析者直接使用。我们可以不懂统计分析原理,但是我们可以通过写一句命令就可以让软件调用统计分析包帮我执行某一个统计分析。

第四,R语言的开放性, 它的更新速度比一般统计软件,如,SPSS,SAS等快得多。最新的统计分析方法,最复杂的方法都能在R语言上发现。

第五,由于它比SPSS、SAS、Stata,注重于编程,相对来说学习起来具有一定难度,但它属于傻瓜式的编程。你能想到的所有统计相关的工作,R都可以非常简洁的用几行命令帮你完成。

对于R语言的真正使用者来说,R最大的问题不是慢,而是程序包的杂乱,嫌它慢的一开始就不会用R。我认为这个问题可以分为两部分,一个是如何选择自己需要的包,一个是如何学习这些包。

我把程序包分为三类,第一种是功能增强型,比如zoo和ggplot2,他们的功能原本可以用繁琐的代码实现,但是使用这些包可以实现的更快或者更好;第二种是统计建模型,专门为某个统计领域或模型而做的包,小到wavelet这种专门做小波分解的包,大到TSA这种所有经济类专业都用的时间序列包都属于这一类。第三种是特定功能型,这种包一般非常小众,比如分解和制造音频的tuneR(可以用它来听股票价格的白噪声哦),再比如我自己写的用于dota2选人的RDota(R版本更新以后已经不能用了暂时懒得更新),这种包一定是要么很专业要么很娱乐,不太需要学习“R”,而是这个功能本身,这一类都不属于下面讨论的范畴。

如何选择自己需要的程序包?

对于功能增强型包,我认为值得系统学习的只有ggplot2,其他的包应该是什么时候用到,或者什么时候见到,就什么时候学。比如你需要处理时间序列了就会用到zoo,或者你上网课看到了什么特定的功能很不错,就留个印象,什么时候需要了再回去翻。再比如你工作的时候觉得R慢,想知道怎么提高R的效率,去谷歌一下"how to improve computing performance in R",就会搜到CRAN官方给出的一片文章CRAN Task View: High-Performance and Parallel Computing with R

所以,见到什么就记,需要什么就搜就可以了,如果你按照R包下载量前10的包一个一个学,你可能其中90%的功能都用不到(没错就是90%,因为每个包里都有很多犄角旮旯你用不到的功能)。

ggplot2实在是太强大了,用熟悉以后哪怕是在matlab里写的程序我也把数据调到R里画图,然而这个包很复杂,从帮助文件里你很难快速上手,因此需要系统学习。