操作上容易上手,简单易学,大部分功能都是可视化呈现的,操作的话点击鼠标就可以完成,常用到的功能没有多少需要编写语句。
较早进入国内市场,发展已经相对成熟,有大量专门介绍spss的中文参考书可供参考,另外很多统计教材也附带spss操作方法。
汉化程度高,无论是操作界面还是结果界面,都可以中文呈现
spss相对r的缺点:
1.不是开源软件,SPSS有版权问题,使用较新版本的spss会受到限制
2.相比于r来说,更吃内存
3.功能的丰富性、全面性远不及r,r的功能包非常多,需要安的时候写个简单的语句就安上了,随用随安,能够做的统计分析比spss多很多,相对而言,spss的定位还是普通的大众的通常需求,而r则是更多统计专业人士的首选
4.做很多统计分析不如r灵活,其实通常来说需要写代码语句的统计软件灵活性都高于那些只需要点击鼠标的,你想做什么分析、想呈现哪些结果,就写相应的语句就好了,不会呈现出冗余的内容。spss的结果呈现常常会包含一些多余的内容,你通常不关心也不需要报告的内容。
使用foreign包中的read.spss()函数,或者Hmisc包中的spss.get()函数read.spss(file, use.value.labels = TRUE, to.data.frame = FALSE,
max.value.labels = Inf, trim.factor.names = FALSE,
trim_values = TRUE, reencode = NA, use.missings = to.data.frame)
help中的example:
## Not run: ## if you have an SPSS file called 'datafile':
read.spss("datafile")
## don't convert value labels to factor levels
read.spss("datafile", use.value.labels = FALSE)
## convert value labels to factors for variables with at most
## ten distinct values.
read.spss("datafile", max.value.labels = 10)
## End(Not run)
r语言更好。R语言自上个世纪90年代起步,发展历史较长,所以对缺失值的处理机制比较完善。
R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。