R语言与统计-1：t检验与秩和检验

2023-02-26 12:46:01Python017

R语言与统计-1：t检验与秩和检验,第1张

一般根据数据是否符合正态分布，选择合适的统计方法：

T检验，亦称student t检验（Student's t test），主要用于样本含量较小（例如n<30），总体标准差σ未知的正态分布资料。t检验是用t分布理论来推论差异发生的概率， 从而比较两个平均数的差异是否显著。 它与 Z检验、卡方检验并列。

其他进行正态性检验的函数 (如下函数都属于nortest包）

Lillie.test()

ad.test()

cvm.test()

pearson.test()

sf.test()

不同的函数可能会得到不同的结果。

对于不服从正态分布的数据，可以采用一些方法使它服从正态分布。

var.test只能用于两样本方差齐性检验

当数据不满足正态分布的时候，要进行t检验必须进行原始数据的变换。如取log，平方根，倒数， boxCox转换等。

Wilcox秩和检验（又称Mann-Whitney U检验）是对原假设的非参数检验，在不需要假设两组样本数据为正态分布的情况下，测试二者数据分布是否存在显著差异，此检验适用于数据分布属于非正态性的分析对象，其适用范围相较于t检验广泛。

执行wilcoxon秩和检验（也称Mann-Whitney U检验）这样一种非参数检验。t检验假设两个样本的数据集之间的差别符合正态分布（当两个样本集都符合正态分布时，t检验效果最佳），但当服从正态分布的假设并不确定时，我们执行wilcoxon秩和检验来验证数据集中mtcars中自动档与手动档汽车的mpg值的分布是否一致，p值<0.05,原假设不成立。意味两者分布不同。警告“无法精确计算带连结的p值“这是因为数据中存在重复的值，一旦去掉重复值，警告就不会出现。

Pascal是一种计算机通用的高级程序设计语言。它由瑞士Niklaus Wirth教授于六十年代末设计并创立。Pascal也可以是指人名，它的取名原本就是为了纪念十七世纪法国著名哲学家和数学家Blaise Pascal，而不是编程工具。以法国数学家命名的pascal语言现已成为使用最广泛的基于DOS的语言之一，其主要特点有：严格的结构化形式；丰富完备的数据类型；运行效率高；查错能力强。

Pascal语言还是一种自编译的语言，这就使它的可靠性大大提高了。

R语言初值为-1，1间的二百个等距分隔表示

>seq(-1,1,by=2/200)

[1] -1.00 -0.99 -0.98 -0.97 -0.96 -0.95 -0.94 -0.93 -0.92 -0.91 -0.90 -0.89

[13] -0.88 -0.87 -0.86 -0.85 -0.84 -0.83 -0.82 -0.81 -0.80 -0.79 -0.78 -0.77

[25] -0.76 -0.75 -0.74 -0.73 -0.72 -0.71 -0.70 -0.69 -0.68 -0.67 -0.66 -0.65

[37] -0.64 -0.63 -0.62 -0.61 -0.60 -0.59 -0.58 -0.57 -0.56 -0.55 -0.54 -0.53

[49] -0.52 -0.51 -0.50 -0.49 -0.48 -0.47 -0.46 -0.45 -0.44 -0.43 -0.42 -0.41

[61] -0.40 -0.39 -0.38 -0.37 -0.36 -0.35 -0.34 -0.33 -0.32 -0.31 -0.30 -0.29

[73] -0.28 -0.27 -0.26 -0.25 -0.24 -0.23 -0.22 -0.21 -0.20 -0.19 -0.18 -0.17

[85] -0.16 -0.15 -0.14 -0.13 -0.12 -0.11 -0.10 -0.09 -0.08 -0.07 -0.06 -0.05

[97] -0.04 -0.03 -0.02 -0.01 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07