请问R语言在一个表中如何筛选出两列有相同部分的行?

Python024

请问R语言在一个表中如何筛选出两列有相同部分的行?,第1张

建议使用排序解决这一问题:单击表格中任何一个有数据的单元格,也就是选中数据清单,然后打开“数据”菜单,选择“排序”,在弹出的对话框中,设置“主要关键字”为要查找相同内容的列标题(如“姓名”),确定,之后表格中的数据相同的记录就会排列在一起。

duplicated()找出重复出现的元素。给出一例子test-c(21,22,22,23,22,23,24)duplicated(test)[1]FALSEFALSETRUEFALSETRUETRUEFALSE看得出duplicated()给出的是判断坐标:首次出现的22,函数给的值是F,但再次出现就成T了。indicator-duplicated(test)table(test[indicator])222321这是重复出现了几次(不包括首次)所以你要的加1就行了。table(test[indicator])+1222332

可以利用as.factor 函数,将该列转换为factor数据类型,在使用summary来看数据信息:

如列表命名为 raw.data

summary(as.factor(raw.data$subject))

就可以了。举一个列子

a<-c("a","a","b","c")

summary(as.factor(a))