卡方拟合优度检验,用于衡量观测频数与期望频数之间的差异
一般地,假设总体分r类 ,分布假设检验问题
在原假设下, 期望频数 :
假设从总体中随机抽取n个样本,并记 为样本中分到类中的个数,称为 观测频数 。
K.Pearson在原假设 成立下:
因此,在显著性水平 下,拒绝域为
p-value = 0.9254>0.05,则不应拒绝原假设,孟德尔的结论是成立的。
同理,可以先计算出
某美发店上半年各月顾客数量如下,请问该店各月顾客数是否为均匀分布?
我们用R语言来模拟一下实际操作
R语言实验结果与示例完全相同。
我们想知道喝牛奶对感冒发病率有没有影响,以下为数据统计的四格表:
从上文中我们通过卡方计算公式手动计算出P在0.1到0.5,说明牛奶对感冒发病率没有影响。
下面我们通过R计算一下具体p直:
x<-matrix(c(43,28,96,84),ncol=2,nrow=2)
chisq.test(x)$p.value
此外出来2X2联表,还可以计算一维表(自由度为个数),例如下面:
判断5种品牌啤酒的爱好者有无显著差异:
P值越大,支持原假设的证据就越强,给定显著性水平α(取0.05), 当P值小于α时,就拒绝原假设。