需要注意的是,如果只提取单列的话,得到的数据就变成了一个vector,而不再是dataframe的格式了。
首先,导入R语言需要加载xlsx包,没有安装这个包的,请用下面的代码进行在线安装:
install.packages("xlsx")选择China的任意一个镜像站点,它会自动安装其他所需的依赖包。
安装好xlsx包后,接下来导入存放在“C:\Users\HWT\Desktop”路径下的“test.xlsx”文件,导入这个文件的代码如下:
library(xlsx)
read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)
我们上面的代码只是把test.xlsx导入了R语言,并没有把它赋给R语言里的某个对象,用下面的代码把数据赋给对象Mydata:
Mydata-read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)。
第一个用table(), 会把所有user的频数显示出来
table(testing$user)第二个就取交集算个数吧。
如果只看user == 2中,item也相同的个数,那么
testuser <- testing[testing$user == 2, ]trainuser <- trainuser[training$user == 2, ]
length(intersect(testuser, trainuser))