假设这一列数为a,a是vector。a[a<-log(0.0000043,10)]。
第一个用table(), 会把所有user的频数显示出来,table(testing$user)。
第二个就取交集算个数吧。
如果只看user == 2中,item也相同的个数,那么
testuser <- testing[testing$user == 2, ]
trainuser <- trainuser[training$user == 2, ]
length(intersect(testuser, trainuser))。
可以利用as.factor 函数,将该列转换为factor数据类型,在使用summary来看数据信息:如列表命名为 raw.data
summary(as.factor(raw.data$subject))
就可以了。举一个列子:
a<-c("a","a","b","c")
summary(as.factor(a))