R语言分布的卡方拟合优度检验

Python026

R语言分布的卡方拟合优度检验,第1张

卡方拟合优度检验,用于衡量观测频数与期望频数之间的差异

一般地,假设总体分r类 ,分布假设检验问题

在原假设下, 期望频数

假设从总体中随机抽取n个样本,并记 为样本中分到类中的个数,称为 观测频数

K.Pearson在原假设 成立下:

因此,在显著性水平 下,拒绝域为

p-value = 0.9254>0.05,则不应拒绝原假设,孟德尔的结论是成立的。

同理,可以先计算出

某美发店上半年各月顾客数量如下,请问该店各月顾客数是否为均匀分布?

我们用R语言来模拟一下实际操作

R语言实验结果与示例完全相同。

方法/步骤

1.录入原始数据。如图所示,原始数据一般采用excel表格来录入,第一列为决策单元序列,比如公司、行业等;后续各列依次是产出和投入变量,切忌产出变量一定要在投入变量前面。

2.分析效率情况。如图所示,将原始数据的格式进行统一调整之后,导入deap分析软件中,设定好相应的程序和命令后,即可运行出数据分析的结果。其中firm是公司序号,crste是技术效率,vrste是纯技术效率,scale是规模效率,最后一列是规模报酬的状态,irs是规模报酬递增,drs是规模报酬递减,-是规模报酬不变。

3

2.分析冗余情况。如图所示,DEA数据分析结果会分别给出投入、产出的冗余量,其中产出冗余数值是表示产出少了多少,而投入冗余则是表示投入多了多少。

4

4.分析参考单元。如图所示,peers表示的是可以作为效率改进参照的公司序号。由结果可见,5和13的决策单元的效率值为一,这样其他公司以此作为参照,对投入产出量进行调整,便可实现DEA有效。