《R语言实战》自学笔记41-生成频数表

Python021

《R语言实战》自学笔记41-生成频数表,第1张

数据准备

频数表是数理统计中由于所观测的数据较多,为简化计算,将这些数据按等间隔分组,然后按选举唱票法数出落在每个组内观测值的个数,称为(组)频数。这样得到的表称“频数表”或“频数分布表”。

列联表(contingency table)是观测数据按两个或更多属性(定性变量)分类时所列出的频数表。它是由两个以上的变量进行交叉分类的频数分布表。列联表可以告诉你组成表格的各种变量组合的频数或比例。列联表分析的基本问题是:观察各属性之间是否独立,做简单的描述性统计。

按两个变量交叉分类的,该列联表称为两维列联表;若按3个变量交叉分类,所得的列联表称为3维列联表,依次类推。一维列联表就是频数分布表。频数就是各个分组中属性出现的次数。

1.一维列联表

2.二维列联表

table(A, B)

其中,A是行变量,B是列变量。

xtabs(~ A + B, data = mydata)

其中的mydata是一个矩阵或数据框。总的来说,要进行交叉分类的变量应出现在公式的右侧(即~符号的右方),以+作为分隔符。

gmodels包CrossTable()

3.多维列联表

参考资料:

添加一个sScrollY属性

var height=$(window).height()

$(document).ready(function() {

$('#example').dataTable(

{

"sScrollY": height

})

在Analyse里点Descriptive Statistics在点Crosstabs,然后把你列联表数据的两个变量名称分别选入ROW和COLUMN(至于哪个放入行,哪个放入列是没有关系的)

如果选择exact-exact,可以输出精确经过,statiisics中选Chi-square,然后再点continiu,OK,就可以了,这样就可以得到P值了