R语言文件读取

Python015

R语言文件读取,第1张

参考文章地址(https://zhuanlan.zhihu.com/p/120422644)

逗号分隔文件 (.csv文件)、 制表符分隔文件 (.tsv文件)和 空格分隔文件 (.txt文件)

(一).csv文件的读取

mydata <- read.csv(file=" ", header=T, sep=",", quote="\", dec=".", fill=T, comment.char=" ")

comment.char用于设置需要跳过的内容,比如需要跳过的行前面有“#”,那么设置comment.char=“#”,当然你也可以设置从中间开始读,注意,这个函数是read.csv里面的哦!

file: 以csv结尾的文件名,由文件所在路径及其文件名构成

header:是否把第一行作为表头

sep:分隔方式,csv文件分隔读入参数设置为"."

                               tsv文件分隔读入参数设置为"\t"

                               txt文件分隔为空格,不需要设置sep参数

也可以通过mydata <- read.table("D:/mydata.csv", header=T, sep=",", row.names="id")读取

(二).tsv文件的读取

mydata <- read.table("D:/mydata.tsv", header=T, sep="\t", row.names="id")

除了分隔方式跟上面一样

(三).txt文件的读取

mydata <- read.table("c:/mydata.txt", header=TRUE, row.names="id")

除了分隔方式跟上面一样

(四)以.gz结尾的压缩文件的读取

1.在R中可以使用gzfile()的方式读取压缩文件

2.使用data.table包里的fread()函数

安装并加载data.table包

install.packages("data.table")

library(data.table)

使用fread()函数读取文件,这里参数和之前的一致,唯一的不同就是fread()可以直接读取压缩文件

mydata <- fread(‘c:/mydata.txt.gz’, header=T, row.names=’id’)

(五)读取.xlsx后缀文件,也就是excel文件

1. 安装并加载openxlsx包

install.packages("openxlsx")

library(openxlsx)

2.进行数据的导入

mydata <- read.xlsx( "mydata.xlsx",rowNames=T)

其他参数可以通过? read.xlsx在R中根据需要进行添加的。

方法1:

getcwd()

然后在我的电脑里输入这个路径

然后在路径名后接上你的命令里所用的相对文件名e.g.d:/work/

../a.apk

d:/work/../a.apk

方法2:

system("where /r \ 你的文件的名字")

system("where /r . 你的文件名字")

r语言system

原文链接

R语言可以读取很多文件,其中以txt文本文件最为灵活,为什么呢,txt文件可以以任意符号作为分隔符,比如“,”,“\t”,空格,甚至`“……&¥¥%¥”`等任意自定义的分隔符号。

这里先把工作空间切换到D盘下面,默认的一般是C盘的文档,我们要有分层管理文件的概念,否则我们还是一个合格的程序员吗?

>setwd('D:\\')

读取文本文件主要用read.table(filePath,header = ,sep=)

filePath就是文件路径,header表示文件是否有头部,我这个文件没有头部,值就为false,sep表示文件是以什么符号作为分隔符号。

头部是什么意思呢?

现在这里有4个文件,分别以空格,逗号,制表符,“/”作为分隔符,下面分别将其读取:

>dat <- read.table('1.txt',header = FALSE,sep = ' ')

>dat2 <- read.table('2.txt',header = FALSE,sep = ',')

>dat3 <- read.table('3.txt',header = FALSE,sep = '\t')

>dat4 <- read.table('4.txt',header = FALSE,sep = '/')

读取出来的数据都是一样的:

因为第二个文件是以逗号作为分隔符,所以也是可以用read.csv()读取的,read.csv()也是一个读取文件函数,后面会讲到。

把刚才读取的数据写入到一个新的文本文件里面,可以用write.table(),形式为:

write.table(dat,file = ,sep = ,row.names,col.names)

分别表示,

dat:被写的数据,

file:文件名(包含路径),

sep:分隔符,

row.names:是否有行名(比如第一行,第二行。。)就是行名,

col.names:是否有列名,同上,

当然了,一般行名与列名需要取有实际意义的名字,比如列名可以取(年龄、性别、成绩,这种表格相信大家应该都见过吧!)。

这里分别用" ","aaa","\t"作为分隔符,生成了3个文件。

>write.table(dat,file = '5.txt',sep = ' ')

>write.table(dat,file = '6.txt',sep = 'aaa')

>write.table(dat,file = '7.txt',sep = '\t')

这样就保存了三个文件。当然了,你可以保存成任意你喜欢、需要的分隔符号。

原文链接: 原文链接