R语言读取大文件fread()

2023-02-23 16:34:01Python022

R语言读取大文件fread(),第1张

# R语言读取大文件fread()

library(data.table)

visitor_sensor<-fread('data_visitor_sensor.csv',header = TRUE)

杀杀

记录一些R语言读入数据的方法还有可能遇到的问题~

读入数据时，需要先了解数据文件的类型（也就是看后缀）。一般就能够知道数据的类型和分隔符等信息。

另外，如果能够用excel预览一下数据的话，可以先看看数据是否有行列名。有些数据会有两列的行名，如基因名-基因id-表达值······，特殊的数据需要额外的处理。

还需要注意一下matrix和data.frame的数据结构，matrix中只能有一种数据类型，这意味着如果在读入数据时不进行合适的处理，R会将数值强行读成字符型，造成读数据的错误。

当用excel存储过之后，再用R处理时，会提示你行名重复，其实根本没有重复。因此建议不要用excel保存这种数据，一定要编辑可以使用notepad++或者ultra edit等软件。

-----正题分割线-----

read.xx的函数是R的内置函数，可以直接读取，并且设置一些参数

这些函数读取后都默认为data.frame，如果需要矩阵请使用as.matrix转换。

一定要赋值，不然R语言会把大大的矩阵print出来。

如果是没怎么见过的类型：

这个函数会自动识别你的分隔符，并且把第一行设为列名，但是没办法指定行名，需要读入以后自己设置

跟read.delim类似，可以读各种类型的文件以及非常大的文件：

读取后默认是一种data.table的数据类型，需要通过as.matrix/as.data.frame转换后使用。

像perl语言一样，逐行读取数据具有很大的优势

（万一文件超多行对吧）对于那种几个G的文件，全部读进来可能会导致你的电脑死机，所以我们可以先读几百行进来看看，或者分批读取，这样不会占用电脑太大内存，读取方法和上文的一次性读入有所不同-随便找个文件举例：

接下来继续读入数据，比如说我现在想读4行，因为文件是txt类型，所以分隔设为\t

第一种：把excel中所有sheet的表格读入为data.frame，并分别命名为每个sheet的名称

---请忽略硬核打码

第二种：把excel中所有sheet的表格读入为矩阵，并放进一个list中

R语言批量读文件

批量读excel的xlsx文件原理是和读其它文件一样的。

学到了新的会持续更新哟~

数据文件语言类型函数

# 上一篇：python爬取网页数据,为啥保存到Excel里面没有东西？

# 下一篇：GO语言（二十九）：模糊测试（下）-

给您推荐相同类型的内容：

Shell 已经很强大了，为什么在 Linux 操作还需要 Python，Ruby
很多的东西shell是做不了的。相对而言Python可能更加强大吧。而且现在的运维和5年前大不相同了，以前会个Linux考个ce感觉很厉害，但是现在呢这些可能是一个基础。运维对技术的要求高了。DEVOPS的出现重新定义了运维，用户p
R语言-均值填充缺失值
在基因芯片数据或其他类型数据中，采用计算所有样本的平均值从而进行填充，如果需要用中位数或其他统计量填充时只需修改相应的方法即可 #1. 检查是否有缺失值 which(is.na(mRNA),arr.ind = T) #2. 计算
金融时间序列分析用R语言建立AR模型？！
对R做平稳性检验，结果显示，在5%的显著性水平下接受拒绝原假设，表明不存在 ... 在建立计量经济模型时，总要选择统计性质优良的模型对上证指数收益率序列AR（3）模型进行条件异方差的ARCHLM检验（滞后8阶），结果给出 AR模型的参数估计
使用Ruby循环结构重写以下伪代码段？
k = (j + 13)27while k &lt= 10k = k + 1i = 3 * k - 1end上面的Ruby代码使用了while循环结构来重写伪代码段。 while循环执行重复操作直到指定的条件不再满足为止。在这
Python实现性能自动化测试竟然如此简单
一、思考❓❔ 1.什么是性能自动化测试?2.Python中的性能自动化测试库？ locust库二、基础操作1.安装locust 安装成功之后，在cmd控制台将会新增一条命令，可输入
java密码加密与解密
以下两个类可以很方便的完成字符串的加密和解密加密 CryptHelper encrypt（password）解密 CrypHelper decrypt（password）代码如下 CryptUtils java
精通C语言和C++能找到哪方面工作
CC++语言应用是非常广泛的，那么学习CC++能用来干什么呢？1. 实验室开发不敢说C++是世界上最好的语言，但C++基本是工科生中的大语言。都说C++兼具面向过程以及面向对象的特性，既拥有比较优秀的运行速度，又有良好的大型项目开发能力
软件c语言，有哪些岗位可以选择
嵌入式软件开发：例如单片机，dsp，arm等；基于嵌入式操作系统的应用软件，驱动程序；基于大型服务的底层任务，如相应的协议栈。ios手机app的开发，安卓app的开发都用c了一般企业岗位为嵌入式软件工程师，驱动工程师，软件工程师等相关职位你
go test 命令介绍
是 go 语言自带的测试工具，其中包含的是两类，通过 go help test 可以看到 go test 的使用说明： go test [-c] [-i] [build flags] [packages] [
Java如何实现文件系统
package com.kiritor.utilimport java.io.Fileimport java.io.FileFilterimport java.util.Arraysimport java.util.Collectionsi
C语言中的清屏有什么作用那
C语言中的清屏的作用为：清除屏幕输出。调用清屏时，屏幕上的所有输出都将被清除，这相当于为软件重新提供了画布以自由输出。屏幕清除通常用于以下情况：1、当最后一个功能的执行完成时，输出不再重要，并且需要显示新的内容或菜单。2、对于加密，
如何看待go语言泛型的最新设计？
Go 由于不支持泛型而臭名昭著，但最近，泛型已接近成为现实。Go 团队实施了一个看起来比较稳定的设计草案，并且正以源到源翻译器原型的形式获得关注。本文讲述的是泛型的最新设计，以及如何自己尝试泛型。例子FIFO Stack假设你要创建一
Java SE 6?JDK 6?JRE 6?各是什么含义?
Java SE 6 指的是Java Platform, Standard Edition java平台的标准版。6版本是6.0Java Platform, Standard Edition 包括jkd和jre。JDK 是指Java De
delve基础用法及在vscode中的使用
delve 是go语言的调试器，delve的目标是为go提供一个简洁、功能齐全的debug工具，delve易于调用和使用。为了能够编译delve，需要安装Go 1.10或更高版本安装好go后，直接go get即可安装，更多安装教
python怎么算平均值
首先我们先来了解一下计算平均数的IPO模式.输入：待输入计算平均数的数。处理：平均数算法输出：平均数明白了程序的IPO模式之后，我们打开本地的python的IDE工具，并新建一个python文件，命名为test6.py.请点击输入图
go语言的channel特性
1、给一个nil channel发送数据，造成永远阻塞 2、从一个nil channel接收数据，造成永远阻塞 3、给一个已经关闭的channel发送数据，引起panic 4、从一个已经关闭的channel接收数据，如果缓冲区中
python相对路径怎么写
相对路径同级目录 -----------直接调用文件名with open(pi.txt') as file_object:contents=file_object.read()print(contents.rstrip())下一级
Java基础面试题都有哪些?
1.java异常机制的原理与应用x0dx0a答：每当程序出现异常之后，如果程序没有进行相应的处理，则程序会出现中断现象。x0dx0a实际上，产生了异常之后，JVM会抛出一个异常类的实例化对象，如果此时使用了try语句捕获的话，则可以
漫画 - 重磅！七国编程集团决定制裁Go语言
2022年6月，编程语言的七国集团会议在风景优美的Linux庄园如期召开。病毒肆虐，各国首脑也都保持了良好的社交距离。C语言作为会议召集人，在大屏幕上用一幅图总结了一下近二十年各国的沉浮。各国代表对C语言的工作纷纷表示赞赏。C语
java一对一聊天室是怎么实现的？
想要实现java一对一聊天室的方法比较简单，要么直接找源码，要么使用第三方的sdk做一些开发。建议可以考虑接入ZEGO即时通讯SDK来实现，支持Android java开发，集成方便，一对一、一对多聊天室都可快速搭建，重要的是不担心消息会丢
C语言的精髓
学语言，网页设计方面的知识，重在动手操作，只要试着多做就会慢慢地好起来。C语言的精髓在于以后章节中将会学到的指针，可以用一句话这样来说：如果没有懂得指针就没有学会C语言。把前面的函数传值、调用等方面的知识学扎实了，后面应该就会觉得很简单。我
大理石英文？如水晶白，水晶黑，进品啡网，古木纹
这个很多网站都有的石材名称英语词汇石材名称英语词汇(1)阿拉伯白 Arabescato Normal埃及红 Aswan Red埃及米黄 New Beige艾丽丝红 Rosa Iris爱斯他银 Oyster Silver安东尼巧克力 Adon
python推荐夜曲还是廖雪峰
夜曲编程这是真正适合从零开始学习Python的编程小白，一个非常有趣的线上课程。廖雪峰官方网站是编程大佬。很多Python入门推荐里都会提到的一个学习渠道我认为更适合稍微有一点点基础的人学习，推荐大家可以学完夜曲编程的入门30天课程后再来廖
java如何创建文件？
public void createFile(){x0dx0ax0dx0apath表示你所创建文件的路径x0dx0aString path = "d:trrt"x0dx0aFile f = new
R语言入门--第十四节（聚类分析）
（1）定义每一个观测值为一类；（2）计算每一类和其它各类的距离；（3）把“距离”最短的两类合并成一类，这样类的个数就减少一个；（4）重复步骤1和步骤2，直到包含所有观测值的类合并成单个类为止。基于5种营养标准含量（变
c语言节日
一个字典结构.c++用标准库或者用字符串查找. ===例子嘛,我以前写的一个英汉对照的程序(相当粗糙的),框架可以套用.======main.cpp#include &ltiostream&gt#include &l
华为c语言编程规范是怎样的
代码总体原则清晰第一。清晰性是易于维护、易于重构的程序必须具备的特征。简洁为美。简介就是易于理解并且易于实现。选择合适的风格，与源代码风格保持一致。头文件头文件的设计体现了大部分的系统设计，不合理的头文件布局是编译时间过长的根因，实际上是不
python求100到200素数
python求100到200素数的程序代码：sushu=[]for i in range(100,201):for j in range(2,i):if i%j==0:breakif i==j+1:sushu.append(i)print(
r如何导出所有的QQ聊天记录
呵呵，如何导出所有的聊天记录？嗯。你可以选择一个人的QQ点击进入，然后打开消息记录，最后找到右上角一个小喇叭的图标。点击进入消息管理器，之后你就可以调出所有人的聊天记录了。。希望对你有所帮助。。1、参考文献设置超链接: 时间分布和成员分析
C语言为什么比其他同类型语言高效？根本原因是什么？
原因比较多：1、它比其它类型的语言更接近硬件，能够直接访问操作内存和进行内存的地址运算。2、直接支持比特(bit)运算，如移位运算等。3、与汇编语言关系密切。相比其它语言都做不到，就自然没有C高效了。另一个方面是由于它的设计初衷决定的。设计

推荐阅读

热门文章

最新发布

标签列表

R语言 读取大文件fread()

给您推荐相同类型的内容：

R语言读取大文件fread()