R语言初步-探索性数据分析EDA-1

Python09

R语言初步-探索性数据分析EDA-1,第1张

探索性数据分析:(exploratory data analysis) ,简称EDA。

例如之前用过的:

生成条形图,展示不同cut钻石的计数结果,cut这个参数的性质决定了它是一个分类变量,所以适合用条形图展示。

条形图中的y轴是geom_bar()函数自行计算的结果,也可以用dplyr::count手动计算:

dplyr::count表示调用dplyr中的count()函数

再比如,有些参数就是连续性的,比如钻石的克拉数carat,所以适合用直方图展示:

直方图会对x轴进行等宽分箱,binwidth参数可以控制间隔宽度,合适的间隔宽度可以揭示不一样的数据特征。比如下面三张图片的区别:binwidth 分别等于0.5、1.0、0.1。

R语言对中文实在不友好,本该中文的地儿都成框了,在绘图中添加参数,或者 par(family = "Songti SC") ,还是觉得不舒服。

如果这样的话,我想进行一次欺骗

FontForge合并字体

B站有个up主用的是fontcreator。采用复制粘贴的方式将两个字体合并。

干脆添加一个启动项吧,也就是说启动R语言的一瞬间,运行 par(family = "Songti SC"

1.在R中输入 .libPaths ,得到

2.在/anaconda3/lib/R中找到文件 Rprofile

3.在 Rprofile 的最后添加

R语言是用于统计分析、绘图的语言和操作环境。R语言是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

R语言是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R语言是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。

r语言的特点:

1、R是自由软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。

2、R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如SPSS、SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。