R语言 -- fread() 函数快速读取大表格

2023-02-23 22:12:01Python028

R语言 -- fread() 函数快速读取大表格,第1张

平时读取一个表格文件通常使用 read.table 函数，但当遇到上百M或上G的文件时，就读的非常慢了。

有个函数 fread() ，来自 data.table 包，可以更快地读取表格文件，速度可以快 近十倍 。

比如现在有个基因组注释文件 Homo_sapiens.GRCh37.87.gtf ，大小为1.1G，分别使用 read.table() 和 fread() 读取所用的时间分别为：

时间分别为30s 和 4s ！

而且对于很大的表格，fread()还会提供读取进度条，非常滴友好~

参考文章地址（https://zhuanlan.zhihu.com/p/120422644）

逗号分隔文件（.csv文件）、制表符分隔文件（.tsv文件）和空格分隔文件（.txt文件）

（一）.csv文件的读取

mydata <- read.csv(file=" ", header=T, sep=",", quote="\", dec=".", fill=T, comment.char=" ")

comment.char用于设置需要跳过的内容，比如需要跳过的行前面有“#”，那么设置comment.char=“#”,当然你也可以设置从中间开始读，注意，这个函数是read.csv里面的哦！

file: 以csv结尾的文件名,由文件所在路径及其文件名构成

header：是否把第一行作为表头

sep：分隔方式，csv文件分隔读入参数设置为"."

tsv文件分隔读入参数设置为"\t"

txt文件分隔为空格，不需要设置sep参数

也可以通过mydata <- read.table("D:/mydata.csv", header=T, sep=",", row.names="id")读取

（二）.tsv文件的读取

mydata <- read.table("D:/mydata.tsv", header=T, sep="\t", row.names="id")

除了分隔方式跟上面一样

（三）.txt文件的读取

mydata <- read.table("c:/mydata.txt", header=TRUE, row.names="id")

除了分隔方式跟上面一样

（四）以.gz结尾的压缩文件的读取

1.在R中可以使用gzfile()的方式读取压缩文件

2.使用data.table包里的fread()函数

安装并加载data.table包

install.packages("data.table")

library(data.table)

使用fread()函数读取文件，这里参数和之前的一致，唯一的不同就是fread()可以直接读取压缩文件

mydata <- fread(‘c:/mydata.txt.gz’, header=T, row.names=’id’)

（五）读取.xlsx后缀文件，也就是excel文件

1. 安装并加载openxlsx包

install.packages("openxlsx")

library(openxlsx)

2.进行数据的导入

mydata <- read.xlsx( "mydata.xlsx"，rowNames=T)

其他参数可以通过? read.xlsx在R中根据需要进行添加的。

文件函数参数表格方式

# 上一篇：Python编程题求助

# 下一篇：如何在 Go 语言中用 Beats 开发 Logstash 插件

给您推荐相同类型的内容：

go语言适合做什么
go语言适用的领域有：Go语言主要用作服务器端开发，其定位是用来开发“大型软件”的，适合于很多程序员一起开发大型软件，并且开发周期长，支持云计算的网络服务。Go语言作为服务器编程语言，很适合处理日志、数据打包、虚拟机处理、文件系统、分布
delve基础用法及在vscode中的使用
delve 是go语言的调试器，delve的目标是为go提供一个简洁、功能齐全的debug工具，delve易于调用和使用。为了能够编译delve，需要安装Go 1.10或更高版本安装好go后，直接go get即可安装，更多安装教
golang hashmap的使用及实现
由于go语言是一个强类型的语言，因此hashmap也是有类型的，具体体现在key和value都必须指定类型，比如声明一个key为string，value也是string的map，需要这样做大部分类型都能做key，某些类型是不能
python可以制作外挂么
Python可以制作游戏外挂，下面就列举一些必备工具吧！Python需要安装autopy和PIL以及pywin32包。autopy是一个自动化操作的python库，可以模拟一些鼠标、键盘事件，还能对屏幕进行访问，本来我想用win32a
rpg大师的脚本语言是什么
『RPG Maker XP』中采用的是『RPG Maker』专用的『Ruby』程序语言『Ruby Game Scripting System』（中文意思是 Ruby 游戏脚本系统），编辑其中的脚本就可以自由更改或增加系统的功能。需要的话，系
女生学java可不可以？
女生学习java是可以的，java是一门面向对象的编程语言，千锋教育有线上免费Java线上公开课。java不仅吸收了c++语言的各种优点，还比c++更容易理解，没有那么多继承指针等概念，因此java语言具有功能强大和简单易用两个特点，Jav
女英文名
容若Roxanne 洛葛仙妮波斯显赫的人，有才气的人Rayna 纯洁的，纯净的女性希伯来容如Rhonda 好矛女性凯尔特Ryba 鱼女性捷克那个曲子是李汉金写的，没有名字，就是纯为了配合电影而创作的一段。如果你非
C语言重要吗？
对于理工科学生来说，这个答案可能很简单，因为这是一门必修课。而对于程序员来说选择一门编程语言，在某种程度上，对职业生涯的发展会产生重大的影响，所以必须慎之又慎。那么，为什么要选择一门诞生了将近半个世纪的语言？本文不是老生常谈的废话，如：
java 数组分片
import java.util.Arrayspublic class Du2 {public static void main(String[] args) {int[] ary = {50 ,70,43,99,77,66,55}int
向下取整符号是什么？
向下取整的意思是：指当计算的结果不为整数时取小于计算结果的整数。称为Floor，用数学符号⌊⌋表示，与之相对的，向上取整的运算称为Ceiling，用数学符号⌈⌉表示。C语言定义的取整运算既不是Floor也不是Ceiling，无论操作数是正
电脑如何恢复网络连接默认设置
1、点击电脑桌面左下方的开始菜单并在弹出的菜单中点击设置选项进入设置页面中。2、在弹出的页面中点击页面上的网络选项。3、在弹出的页面中点击页面上的状态选项。4、在弹出的页面中点击网络重置选项。5、在重置确认页面点击立即重置即可。1. 电脑
Golang nethttp 爬虫[1]
上周从零学习了golang，语法简单关键字少，写个爬虫熟悉一下语法结构。首先选用了原生的nethttp包，基本上涵盖了所有的getpost请求，各种参数都可以设置，网上google到html页面解析goquery神器，很轻松就可
java中关于GridlBagConstraints构造函数用法
gbc1=new GridBagConstraints(0, 0, 1, 1, 10, 10, GridBagConstraints.CENTER,GridBagConstraints.BOTH, new Insets(0, 0, 0
JAVA中如何让程序暂停?
看到的回答确实有点不明不白的。楼主估计已经搞定了吧，应该是这么做的在你想要暂停的地方加上下面这段程序try{ Thread.sleep(10000)}catch(Exception e){ }不需要添加什么包哦，sleep里
python里面e符号代表什么？
代表“科学计数法符号”。科学记数法是一种计数的方法，把一个数表示成a与10的e次幂相乘的形式，可以用带“E”的格式表示。例如，1.03乘10的8次方，可简写为“1.03E+08”的形式。当人们要标记或运算某个较大或较小且位数较多时，用科学
r语言导入的数据.dat包怎么删除
R语⾔查看已加载包、卸除加载包及安装包与卸载包1、查看已加载的包(.packages())注意外⾯的括号和前⾯的点不能省。包被安装后，在使⽤前需要加载。加载包使⽤命令 library(包名)，⽐如library(codetools)。查看有
r语言怎么读取txt文件
1、r语言读取txt文件的方法：首先根据下图图片中的命令代码进行输入2、然后这样就可以读取txt文件了，结果图如下：3、R读取csv文件的方法：在读取csv文件时，分割符为“，”；可以根据下方的代码进行编辑。read.csv(file,
“JAVA”应该说怎么读？
java的读音：jia wa。以前也有人称为：zhua wa的。但是正规的读法应该是：jia wa（音译：家哇）java是一款面向对象的高级编程语言，其中又分为三部分，j2se,j2ee,j2me，分别表示java基础部分，java面向企业
R语言之基础
向量是 R 语言中最基本的数据类型，在 R 中没有单独的标量（例如 1 本质上是 c(1)）。 R 中可以用 = 或者 &lt- 来进行赋值， &lt-的快捷键是 alt + - 。 R的下标是从1开始的，和py
Go 是怎么使用 Go 来编译自身的
是Go语言吗? Go 编译过程九个步骤第一步. all.bash% cd $GOROOTsrc% .all.bash第一步 all.bash 只是调用了另外两个 shell 脚本：make.bash 和run.bash。若使用 Win
Go语言的%d,%p,%v等占位符的使用
这些是死知识，把常用的记住，不常用的直接查表就行了 golang 的fmt 包实现了格式化IO函数，类似于C的 printf 和 scanf。 type Human struct { Name string } var
用C语言编写一个浪漫软件
#include&ltiostream&gtusing namespace stdvoid prinstar(void){ cout&lt&lt" 爱爱爱爱爱爱爱爱爱爱爱爱爱"&a
python的输入输出语句“print(1+3**3*2)”结果是？
在 Python 中，输入输出语句 "print(1+3**3*2)" 的结果为 19。在 Python 中，** 运算符用于计算幂，所以 33 等于 3 的三次方，即 27。然后，在这个表达式中，乘法运算符（*）和加法
Python的while循环2个应用和注意事项
利用while循环的应用把whlei的语法和执行流程更高层次的理解和体会。需求：计算1-100数字累加和分析： 1-100的累计价和，即1+2+3+4+5+6+...+100，即前面两个数组的相加结果加上下一个数字（下一个数
dlib库，怎么在python中安装
因为这个工程中用到的依赖库比较多，所以索性下载了Anaconda，它是一个python的发行版，包括了python和很多常见的软件库, 和一个包管理器conda，所以安装了Anaconda后就不用再安装python了。 1、下载Anacon
子集和问题的一个实例为〈S,t〉。其中，S={ x1， x2，…， xn}是一个正整数的集合，c是一个正整数。子集和
给定n 个整数的集合X={x1，x2，...，xn}和一个正整数y，编写一个回溯算法，在X中寻找子集Yi，使得Yi中元素之和等于y。#include &ltstdio.h&gt#include &ltconio.h&
c语言fread函数的用法
C语言中：fread是一个函数。从一个文件流中读数据，最多读取count个元素，每个元素size字节，如果调用成功返回实际读取到的元素个数，如果不成功或读到文件末尾返回 0。下面我们来看看c语言fread函数的用法。 fread()函数
电脑密码忘了怎么办最简单的方法
1.重新启动计算机，开机后按下F8键不动直到高级选项画面出现后，再松开手，选择“命令提示符的安全模式”按回车。2.运行过程结束时，系统列出了系统超级用户“administrator”和本地用户“*****”的选择菜单，鼠标单击“admini
python认证证书有哪些
python认证证书有很多，比如常见的证书有：全国计算机等级考试Python程序语言设计、Python Institute资格认证初级PCEP证书、Python Institute资格认证中级PCAP证书、Python Institute资
最简单的R语言绘图，教你10分钟搞定入门绘图
R语言上手还是比较简单的，我们哪怕是一个小白，但是对于R,也不应该害怕呀，让我们一起来看看R的绘图吧，小白没关系，跟着我走，包您看懂！让您对R越来越感兴趣！哈哈，数据，我们需要数据！在这里我们无需考虑数据来自何处，对于入门，为了增加大

推荐阅读

热门文章

最新发布

标签列表

R语言 -- fread() 函数快速读取大表格

给您推荐相同类型的内容：