如何用r语言将某一列中某些含特殊值的行全部挑出并制作新表

Python012

如何用r语言将某一列中某些含特殊值的行全部挑出并制作新表,第1张

最简单的方法,数据框的名称,加上你要提取的列数,示例如下:

需要注意的是,如果只提取单列的话,得到的数据就变成了一个vector,而不再是dataframe的格式了。

首先,导入R语言需要加载xlsx包,没有安装这个包的,请用下面的代码进行在线安装:

install.packages("xlsx")选择China的任意一个镜像站点,它会自动安装其他所需的依赖包。

安装好xlsx包后,接下来导入存放在“C:\Users\HWT\Desktop”路径下的“test.xlsx”文件,导入这个文件的代码如下:

library(xlsx)

read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)

我们上面的代码只是把test.xlsx导入了R语言,并没有把它赋给R语言里的某个对象,用下面的代码把数据赋给对象Mydata:

Mydata-read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)。

假如已经将上面的数据读入了R中的data.frame中,并保存为df变量

library(stringr)

df$ID <- row.names(df)

df$ID <- str_extract(df$ID, '\\d+')##提取数字

Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那么就是从1开始自增的Sequence来标识每一行。初始化使用data.frame函数就可以初始化一个Data Frame。比如我们要初始化一个student的Data Frame其中包含ID和Name还有Gender以及Birthdate,那么代码为:student<-data.frame(ID=c(11,12,13),Name=c("Devin","Edward","Wenli"),Gender=c("M","M","F"),Birthdate=c("1984-12-29","1983-5-6","1986-8-8”))另外也可以使用read.table() read.csv()读取一个文本文件,