r语言中如何从一组数据筛选出符合条件的值,求R的筛选code。

Python034

r语言中如何从一组数据筛选出符合条件的值,求R的筛选code。,第1张

假设这一列数为a,a是vector。a[a<-log(0.0000043,10)]。

第一个用table(), 会把所有user的频数显示出来,table(testing$user)。

第二个就取交集算个数吧。

如果只看user == 2中,item也相同的个数,那么

testuser <- testing[testing$user == 2, ]

trainuser <- trainuser[training$user == 2, ]

length(intersect(testuser, trainuser))。

杀杀

前两天一个同学问了一个批量数据文件)的问题

感觉现在分析测序数据的话,在R中一次性读取多个文件的功能还是挺需要用到的

决定总结一下下

总不能写n行read.csv…balabala…去读取,那太麻烦了

于是决定使用批量读数据

首先我们要获取这个文件夹里所有的文件名字以便读取

接下来我们需要构建读文件的路径

ps: 在做这种批量操作时还是有必要先花时间测试一个样本是否能够成功,然后再去做批量的循环,这样也能方便自己找bug

因此我们先试着读取一个文件

这里因为例子中的文件格式比较特殊,所以使用的读取函数是read.delim,如果是.csv或.txt等格式,也可以替换成read.csv, read.table等函数。

好了测试通过,接下来开始批量读文件

需要注意的是,合并文件的时候,需要注意你是要取所有文件中行名的交集还是并集,或者最后你是否有一个统一的行名来规整所有文件。(当然如果你确定每个文件的行名都是相同的,就可以直接cbind),我遇到过需要取交集的情况,可以写一个循环对每个文件的行名做交集,用最终的交集文件去match出所有你要的行然后合并。

但是这个例子中,有的文件的行名是1-4000,有的是5000-8000,存在非常大的差异,而需求是最后整合成一个行名为0-8000的矩阵,因此我先建立一个0-8000的列作为行名,把每个文件和这列进行一个match操作,然后未match到的填充为0。

其实没有很难的部分,主要是需要读取文件夹中的所有文件名,然后循环读取就行了。

VennDiagram 包

R语言:VennDiagram绘制venn图

venn.diagram rdocumentation

参数介绍

输入数据类型

第一种输入数据,表格型输入数据

可以看到这里的示例数据,行是要取交集的对象即电影名称,列是每个对象的具体信息(上映年份,动作片,恐怖片,爱情片等等),一般只有两个取值, 1或0 ,是与否

第二种输入数据,fromExpression对向量进行转化

可以看到,转换后的数据行名是每个对象,比如可以是基因,列名则是每个对象的具体情况,比如基因A在算法1,算法2,算法3中是否差异,是否富集等信息。

进一步探究如何将年份这个变量加进这张图可以参考 UpSetR:集合可视化神包