r语言如何导入excel数据

Python011

r语言如何导入excel数据,第1张

xlsx包不是R语言自带的包,必须额外安装xlsx包的依赖包也得安装,依赖包装好了才能加载xlsx包。

电脑:华为MateBook14

系统:Windows10

软件:1.0R语言、xlsx包

1、首先,导入R语言需要加载xlsx包,没有安装这个包的,请用下面的代码进行在线安装:

install.packages("xlsx"),选择China的任意一个镜像站点,它会自动安装其他所需的依赖包。

2、安装好xlsx包后,接下来导入存放在“C:\Users\HWT\Desktop”路径下的“test.xlsx”文件,导入这个文件的代码如下library(xlsx)

read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)。

3、我们上面的代码只是把test.xlsx导入了R语言,并没有把它赋给R语言里的某个对象,用下面的代码把数据赋给对象Mydata:

Mydata<-read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)。

4、那么如何查看Mydata里面的数据呢?只需要输入“Mydata”即可。

5、接下来教大家导入xls格式的数据,其实这个很简单,只要把前面代码的xlsx改为xls就可以了,

read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xls",sheetIndex=1)。

R语言读取excel文件文件其实有很多的包可以做到,最常用的就是xlsx和readxl, 首先,安装并载入读取excel文件所用的包:

install.packages("xlsx") library(xlsx)

或者,

install.packages("readxl") library(readxl)

两个包的基本介绍

xlsx是用R把excel文件中的工作表以data.frame的格式读入R语言,他有两个常用函数,其中read.xlsx2通常会比read.xlsx读取的速度更快一些,因为它的好多工作是利用Java完成的,所以速度有所提升,但是在读取子数据集的时候没有read.xlsx稳定性好。

read.xlsx(file, sheetIndex, sheetName=NULL, rowIndex=NULL, startRow=NULL, endRow=NULL, colIndex=NULL, as.data.frame=TRUE, header=TRUE, colClasses=NA, keepFormulas=FALSE, encoding="unknown", ...)

read.xlsx2(file, sheetIndex, sheetName=NULL, startRow=1, colIndex=NULL, endRow=NULL, as.data.frame=TRUE, header=TRUE, colClasses="character", ...)

注:

sheetIndex:工作表单号

rowIndex:行号,就是你想读取那些行

header:表头,就是有没有列名。比如姓名,年龄,学号等

startRow:比如你想从第五行开始读取,就设置startRow = 5

readxl包可以用来读取xls和xlsx格式的文件

read_excel(path, sheet = 1, col_names = TRUE, col_types = NULL, na = "", skip = 0)

注:

sheet:读取的工作表

col_names: 如果是FALSE的话,就表示第一行不是列名,R会自动给你取成x1,x2...

colt_types: blank,numeric,date,text

na: 缺失值,默认空着的单元是缺失值,你也可以自己指定,比如认为999是缺失值