初学R语言需要用什么书比较好~怎么学R语言

Python06

初学R语言需要用什么书比较好~怎么学R语言,第1张

首先R是一种专业性很强的统计语言如果想学得快一些的话,基本的统计学知识要懂,不然很多东西会掌握的比较慢。

掌握基本语法和操作,推荐国内的已经翻译的比如《R语言实战》《R语言编程艺术》,这个过程中最好结合一些小例子来做一些分析的东西。其他还有《R语言实例》《R语言核心技术手册》也都是很好的书!如果需要可视化的话,强烈不推荐学习R本身的作图系统,实在是太不友好了.....还是用ggplot2吧。

掌握了上面的,就可以深入一些了,如果是做数据分析和可视化,推荐《ggplot2:数据分析与图形艺术》,这个才是作图的神器啊.....如果是空间分析相关的,推荐《Applied Spatial Data Analysis with R》,这个如果可以的话看英文版,而且要有地学的一些知识背景,中文版翻译的太次了,尽量不要看。数据挖掘机器学习之类的,可以看看比如《数据挖掘与R语言》、《机器学习——实用案例解析》,不过我觉得这几本书没上面的那几本好,但是可以大概看看是咋回事,最好还是看看专门的相关书籍,熟悉各种算法和流程,到时候搜索R的package,照着文档和例子搞定,不是特别难。

最后,强烈推荐统计之都、R-bloggers,统计之都以及谢益辉、肖凯、刘思喆等人的博客(自行Google以及到上面的网站找链接),订阅一下,会很有帮助,RStudio是个很棒的IDE,用起来很爽,功能很强大。

总之,你可以从《R语言实战》开始出发吧!

开始一个新的R语言数据分析新项目,管理脚本、图片、文件的推荐方式:打开Rstudio,新建Rproject,新建脚本(脚本存放在生成的Rproject文件夹中)。

若要逆着优先顺序操作,将返回NA

x %in%y是判断x中的每一个元素是否在y中存在。

若x和y长度不一致,返回x个TRUE或者FALSE。

⚠️练习:按如下方式生成test数据框,提取test中,最后一列值为a或c的行,组成一个新的数据框,赋值给test2。

这里如果使用==来判断,就相当于拿test$n的15个值与c('a','c')的2个值来一一对应着比对,因为两者长度不同,会发生循环补齐,其效果如下图,明显不是我们想要的结果。

x%in%y:选出x是y中一个值时的所有行

另:取交集、差集、并集的函数为:intersect(x,y)、union(x,y)、setdiff(x,y)、setdiff(y,x)

match函数的用法参考: https://blog.csdn.net/woodcorpse/article/details/84927296

使用match函数修改矩阵的信息

方法1--设置CRAN镜像:打开R studio,点击tools--global option--packages,选择Package CRAN reposotory。

方法2--设置CRAN和bioconductor镜像

用于读取/导出文件的R包

rio可以不用区分读入文件类型,大部分文件可直接用import()读取。

@ 是R中,S4类的一个操作符, 用于提取S4对象中的内容(slot) ,比如:

这个时候$是不起作用的,因为被S4类重写了。可以自己定义$的行为。

⚠️: matrix不能直接用$取列

⚠️因此如果想取数据框中的部分行,在方括号中直接输入行数即可,返回的仍然是数据框。但如果加了逗号,会丧失数据框的格式,也就是会使数据框的行名(往往是基因名)丢失。

后面存图时可以用paste0连接GSE编号和图片类型及后缀,这样不同数据的分析得到的图片名就跟数据相一致。

通过将变量因子化来设置柱条的顺序