R是现在最好的数据科学语言吗

Python014

R是现在最好的数据科学语言吗,第1张

应该说是应用比较广的一种数据科学语言

R语言的优点:

1. 免费... 开源... (这也是SAS流行于公司,R流行于研究机构和大学的最主要原因)

2. 是专门为统计和数据分析开发的语言,各种功能和函数琳琅满目,其中成熟稳定的一抓一把

3. 语言简单易学。虽与C语言之类的程序设计语言已差别很大(比如语言结构相对松散,使用变量前不需明确正式定义变量类型等等),但仍保留了程序设计语言的基础逻辑与自然的语言风格。

4. 小... 安装程序只有50Mb左右, 因为体积轻便,运行起来系统负担也小。

5. 同各种OS的兼容性好。

6. 因为用的人越来越多,又是开源,有很多配套的“插件”为其锦上添花。

这是我在 Why R | learnR 中总结出的几点R的优势,其中一些可以认为是R对Matlab的优势:

免费。不需要任何授权费用,对于个人和企业来说在成本方面都有一定的吸引力。

开源。源代码的开放保证了你可以知道所有的细节,对于开发者和企业级应用是有价值的。

在统计、计量、数据挖掘、可视化群体中的流行度较高。这一点在国外可能更加成立,这就使得R成为了一个这类群体的大众语言,描述问题和交流起来非常方便。(Seven quick facts about R)

语言灵活度高。作为一个动态类型的语言,R语言的设计是比较良好的,对于元编程、函数式编程支持度也很好,使得语言具有非常强的灵活性,允许开发者对语言进行计算(computing on language),以及进行非标准计算(non-standard evaluation),使得语言灵活性和可操作性大大提升。

可重复。R+Markdown等等工具产生的文档和结论是完全可重复的,对于研究的科学性有贡献。

资源丰富。对于使用者而言,R的开放性使得其社区巨大,接近6000个扩展包涵盖了各种相关领域的方方面面。博客、文章、会议等等都很多。目前正有不少扩展包作者在把优秀的javascript library引入R,主要是数据可视化,绘制动态、互动、矢量数据图像。对于开发者而言,许多开发方面的资源也可以使用,比如扩展包的自动化测试可以用 Travis CI 完成等等。对于一些高级使用者,同样可以在R中通过Rcpp或Rcpp11扩展包无缝调用C++的代码(比如实现高性能算法、用C++里面的一些矩阵计算库等等),也可以通过rJava调用Java代码,通过rClr调用.NET代码...

社区强大。整个社区仍然处于高速成长当中,在stackoverflow上的问答活跃度也相当高。

前沿。不少统计、计量等等新工具在学术界发表,作者本人或者团队会在第一时间、甚至文章发表前就发布基于这个文章的R扩展包,使得其几乎总是走在学术界前沿。

R语言是用于统计分析、绘图的语言和操作环境。R语言是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

R语言是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R语言是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。

r语言的特点:

1、R是自由软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。

2、R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如SPSS、SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。