求生物统计学大神!

Python023

求生物统计学大神!,第1张

首先要知道这是用什么统计方法。这个题目抽象来说是判断连续型变量均值是否等于一个总体均值,因此首先想到的是t检验。因为这里不太方便打公式,我用R语言表达公式

假设所有数据在向量x里面

x=c(39,...,41)

1.计算样本的均值

a=mean(x)=42

2. 假设总体的均值是b

b=43.38

3. 计算样本的标准差

c=sd(x)=3.0912

4. 样本量

n=10

5.计算t统计量

t=(a-b)/c/sqrt(n)=-0.1412,在这里sqrt指的是开根号

6.算出t统计量后,找到自由度为1的t分布的界值,

t*=-6.31

7.比较t与t*发现t要小,于是不拒绝H0,尚不能说明样本的均值与总体不同

  生物统计学是生物数学中最早形成的一大分支,它是在用统计学的原理和方法研究生物学的客观现象及问题的过程中形成的,生物学中的问题又促使生物统计学中大部分基本方法进一步发展。生物统计学是应用统计学的分支,它将统计方法应用到医学及生物学领域,对于生物医学领域科研人员及在读学生,理解好统计学的基本方法及原理,才能真正准确的运用统计学的方法分析解释科研数据,得出更令人信服的结论,本系列专题将配合统计开源工具R语言系统介绍统计学在生物医学领域的原理及用法。

大数定律:重要实验测试足够多,样本均值就会趋近于总体的期望值。

中心极限定理:许多小的随机因素的叠加总会使总体的分布趋近于正态分布;不管总体分布是什么,只要样本量足够大,就可以把样本的均值视为服从正态分布。

数据分布情况

离散型变量:

吸烟情况

列表

饼图

两个变量之间的关系

两个连续变量(身高体重):

散点图

一个离散一个连续:

吸烟和身高

检查异常值