R语言数据筛选问题

Python010

R语言数据筛选问题,第1张

>>> data1 <- data7_0 %>% 

             group_by(CELLPHONE,MEMBERID) %>%             filter(row_number() == 1) %>%             ungroup()1234

方法二:

>>> data2 <- data7_0 %>% 

             distinct(CELLPHONE,MEMBERID, .keep_all = TRUE)12

方法三:

>>> data3 <- sqldf("select DISTINCT CELLPHONE,MEMBERID from data7_0")1

方法四:

>>> data4 <- base::unique(data7_0)1

方法五:

>>> data5 <- as.data.table(data7_0[!duplicated(data7_0$CELLPHONE), ])

假设这一列数为a,a是vector。a[a<-log(0.0000043,10)]。

第一个用table(), 会把所有user的频数显示出来,table(testing$user)。

第二个就取交集算个数吧。

如果只看user == 2中,item也相同的个数,那么

testuser <- testing[testing$user == 2, ]

trainuser <- trainuser[training$user == 2, ]

length(intersect(testuser, trainuser))。

你可以用EXCEL中的“自动筛选”功能。选中数据第一行,按工具栏中的“数据-筛选-自动筛选”,就会在数据第一行出现下拉框,点中它,从下拉框中选“自定义”,会出现一个对话框,在这个对话框的左边框中选“包含”,右边框中填上“公园”(不要引号),确定后就把所有含有“公园”的数据筛选出来了,其他的会自动隐藏。同理,在“包含”的右边框中填上“门店”,就会把所有含有“门店”的数据筛选出来。