R语言数据筛选问题

Python012

R语言数据筛选问题,第1张

>>> data1 <- data7_0 %>% 

             group_by(CELLPHONE,MEMBERID) %>%             filter(row_number() == 1) %>%             ungroup()1234

方法二:

>>> data2 <- data7_0 %>% 

             distinct(CELLPHONE,MEMBERID, .keep_all = TRUE)12

方法三:

>>> data3 <- sqldf("select DISTINCT CELLPHONE,MEMBERID from data7_0")1

方法四:

>>> data4 <- base::unique(data7_0)1

方法五:

>>> data5 <- as.data.table(data7_0[!duplicated(data7_0$CELLPHONE), ])

可以利用as.factor 函数,将该列转换为factor数据类型,在使用summary来看数据信息:

如列表命名为 raw.data

summary(as.factor(raw.data$subject))

就可以了。举一个列子

a<-c("a","a","b","c")

summary(as.factor(a))