subset函数,从某一个数据框中选择出符合某条件的数据或是相关的列
(1)单条件查询
>selectresult=subset(df1,name=="aa")
>selectresult
name age sex
1 aa 20 f
>df1
name age sex
1 aa 20 f
2 bb 29 m
3 cc 30 f
(2)指定显示列
>selectresult=subset(df1,name=="aa",select=c(age,sex))
>selectresult
age sex
1 20 f
(3)多条件查询
>selectresult=subset(df1,name=="aa" &sex=="f",select=c(age,sex))
>selectresult
age sex
1 20 f
>df1
name age sex
1 aa 20 f
2 bb 29 m
3 cc 30 f
假设这一列数为a,a是vector。a[a<-log(0.0000043,10)]。
第一个用table(), 会把所有user的频数显示出来,table(testing$user)。
第二个就取交集算个数吧。
如果只看user == 2中,item也相同的个数,那么
testuser <- testing[testing$user == 2, ]
trainuser <- trainuser[training$user == 2, ]
length(intersect(testuser, trainuser))。