R 语言
R 的源代码可自由下载使用,亦有已编译的可执行文件版本可以下载,可在多种平台下运行,包括 UNIX(也包括 FreeBSD 和 Linux)、Windows 和 MacOS。R 主要是以命令行操作,同时有人开发了几种图形用户界面,其中 RStudio 是最为广泛使用的集成开发环境。
R 内置多种统计学及数字分析功能。R 的功能也可以透过安装包(Packages,用户撰写的功能)增强。因为 S 的血缘,R 比其他统计学或数学专用的编程语言有更强的面向对象(面向对象程序设计, S3, S4 等)功能。
R 的另一强项是绘图功能,制图具有印刷的素质,也可加入数学符号。
虽然 R 主要用于统计分析或者开发统计相关的软件,但也有人用作矩阵计算。其分析速度可媲美专用于矩阵计算的自由软件 GNU Octave 和商业软件 MATLAB。
1、数据结构复杂程度不同
R中的数据结构非常的简单,主要包括向量一维、多维数组二维时为矩阵、列表非结构化数据、数据框结构化数据。
Python 则包含更丰富的数据结构来实现数据更精准的访问和内存控制,多维数组。
2、适用场景不同
R适用于数据分析任务需要独立计算或单个服务器的应用场景。
Python作为一种粘合剂语言,在数据分析任务中需要与Web应用程序集成或者当一条统计代码需要插入到生产数据库中时,使用Python更好。
3、数据处理能力不同
有了大量针对专业程序员以及非专业程序员的软件包和库的支持,不管是执行统计测试还是创建机器学习模型,R语言都得心应手。
Python最初在数据分析方面不是特别擅长,但随着NumPy、Pandas以及其他扩展库的推出,它已经逐渐在数据分析领域获得了广泛的应用。
4、开发环境不同
对于R语言,需要使用R Studio。
对于Python,有很多Python IDE可供选择,其中Spyder和IPython Notebook是最受欢迎的。