R语言 -- fread() 函数快速读取大表格

Python017

R语言 -- fread() 函数快速读取大表格,第1张

平时读取一个表格文件通常使用 read.table 函数,但当遇到上百M或上G的文件时,就读的非常慢了。

有个函数 fread() ,来自 data.table 包,可以更快地读取表格文件,速度可以快 近十倍

比如现在有个基因组注释文件 Homo_sapiens.GRCh37.87.gtf ,大小为1.1G,分别使用 read.table() 和 fread() 读取所用的时间分别为:

时间分别为30s 和 4s !

而且对于很大的表格,fread()还会提供读取进度条,非常滴友好~

# R语言 读取大文件fread()

library(data.table)

visitor_sensor<-fread('data_visitor_sensor.csv',header = TRUE)