group_by(CELLPHONE,MEMBERID) %>% filter(row_number() == 1) %>% ungroup()1234
方法二:
>>> data2 <- data7_0 %>%
distinct(CELLPHONE,MEMBERID, .keep_all = TRUE)12
方法三:
>>> data3 <- sqldf("select DISTINCT CELLPHONE,MEMBERID from data7_0")1
方法四:
>>> data4 <- base::unique(data7_0)1
方法五:
>>> data5 <- as.data.table(data7_0[!duplicated(data7_0$CELLPHONE), ])
你可以用EXCEL中的“自动筛选”功能。选中数据第一行,按工具栏中的“数据-筛选-自动筛选”,就会在数据第一行出现下拉框,点中它,从下拉框中选“自定义”,会出现一个对话框,在这个对话框的左边框中选“包含”,右边框中填上“公园”(不要引号),确定后就把所有含有“公园”的数据筛选出来了,其他的会自动隐藏。同理,在“包含”的右边框中填上“门店”,就会把所有含有“门店”的数据筛选出来。可以利用as.factor 函数,将该列转换为factor数据类型,在使用summary来看数据信息:如列表命名为 raw.data
summary(as.factor(raw.data$subject))
就可以了。举一个列子:
a<-c("a","a","b","c")
summary(as.factor(a))