r语言 如何获取某一列的数值范围

Python067

r语言 如何获取某一列的数值范围,第1张

用fgets函数读取文件中某行的数据,某列数据就必须读入每行的第几个字符,再存入到一个字符串当里。

例:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

#include<stdio.h>

#include<string.h>

voidmain()

{

chara[100],b[100],c[100]

inti=3,j=4,k=0//第三行,第四列

FILE*fp=fopen("data.txt","r")

while(fgets(c,100,fp)){//读入每行数据

i--

if(i==0)strcpy(a,c)//读到第三行数据

b[k++]=c[j-1]//把每行的那列字符拷到b中

}

b[k]=0

printf("第%d行数据:%s\n",i,a)

printf("第%d列数据:%s\n",j,b)

fclose(fp)

扩展资料

R语言的使用

read.csv/csv2:逗号分隔数据读取

.csv可能是目前最常见的平面文件类型了。它代表的是comma-separatedvalues,简单来讲就是,文件里每一个单独的数据值都是用逗号进行分隔的。

数据文件被读取到R工作环境中的第一步通常为调用str函数来对该数据对象进行初步检视,下面的代码列出了该函数最简单的使用方式。

>str(object=flights)

'data.frame':6obs.of6variables:

$carrier:Factorw/4levels"AA","B6","DL",..:441234

$flight:int1545171411417254611696

$tailnum:Factorw/6levels"N14228","N24211",..:124653

$origin:Factorw/3levels"EWR","JFK","LGA":132231

$dest:Factorw/5levels"ATL","BQN","IAH",..:334215

$air_time:int227227160183116150

杀杀

记录一些R语言读入数据的方法还有可能遇到的问题~

读入数据时,需要先了解数据文件的类型(也就是看后缀)。一般就能够知道数据的类型和分隔符等信息。

另外,如果能够用excel预览一下数据的话,可以先看看数据是否有行列名。有些数据会有两列的行名,如基因名-基因id-表达值······,特殊的数据需要额外的处理。

还需要注意一下matrix和data.frame的数据结构,matrix中只能有一种数据类型,这意味着如果在读入数据时不进行合适的处理,R会将数值强行读成字符型,造成读数据的错误。

当用excel存储过之后,再用R处理时,会提示你行名重复,其实根本没有重复。因此建议不要用excel保存这种数据,一定要编辑可以使用notepad++或者ultra edit等软件。

-----正题分割线-----

read.xx的函数是R的内置函数,可以直接读取,并且设置一些参数

这些函数读取后都默认为data.frame,如果需要矩阵请使用as.matrix转换。

一定要赋值,不然R语言会把大大的矩阵print出来。

如果是没怎么见过的类型:

这个函数会自动识别你的分隔符,并且把第一行设为列名,但是没办法指定行名,需要读入以后自己设置

跟read.delim类似,可以读各种类型的文件以及非常大的文件:

读取后默认是一种data.table的数据类型,需要通过as.matrix/as.data.frame转换后使用。

像perl语言一样,逐行读取数据具有很大的优势

(万一文件超多行对吧)对于那种几个G的文件,全部读进来可能会导致你的电脑死机,所以我们可以先读几百行进来看看,或者分批读取,这样不会占用电脑太大内存,读取方法和上文的一次性读入有所不同-随便找个文件举例:

接下来继续读入数据,比如说我现在想读4行,因为文件是txt类型,所以分隔设为\t

第一种:把excel中所有sheet的表格读入为data.frame,并分别命名为每个sheet的名称

---请忽略硬核打码

第二种:把excel中所有sheet的表格读入为矩阵,并放进一个list中

R语言批量读文件

批量读excel的xlsx文件原理是和读其它文件一样的。

学到了新的会持续更新哟~

最简单的方法,数据框的名称,加上你要提取的列数,示例如下:

需要注意的是,如果只提取单列的话,得到的数据就变成了一个vector,而不再是dataframe的格式了。