运用r语言分析,在这些案件中,谋杀可以判处死刑。试用统计学知识分析数据,判断 判决是否公平公正。

Python013

运用r语言分析,在这些案件中,谋杀可以判处死刑。试用统计学知识分析数据,判断 判决是否公平公正。,第1张

t<-matrix(c(33,33,29,4,251,508,587,76),nrow=4)

attributes(t)<-list(dim=c(4,2),class="ftable",

row.vars=list(c("受害白","受害非白"),c("被告非白","被告白")),

col.vars=list(c("死刑","没有死刑")))

chisq.test(t)

fisher.test(t)

p值都很小,所以受害人/被告人的种族和死刑的判决多半不是相互独立的(拒绝null hypothesis),也就是“可能”不公正。个人认为这些数据是纯粹观察得到的,所以应该不能得出那么强的结论,比如说万一非白人作案的时候证据留得多呢?(完全只是举例,不是歧视非白人)

原理参考 文章 ,主要思想我认为是求出所有分布的可能(中间的一般为零假设),出现这种分布的概率。

distribution= 参数可为exact(精确模式,即依据所有可能的排列组合,仅适用于两样本问题)、approxiamate(nresample=#)(蒙特卡洛抽样,#指需要重复的次数)、asymptotic(渐进分布抽样)

lmPerm包更擅长方差分析。示例实验设计仍为5组接受不同治疗方法的多组结果比较。

实验示例仍为关节炎的治疗(两种)与效果(无、部分、显著)间的关系

实验示例为研究文盲率与谋杀率是否相关

主要为 lmp() 、 aovp() 两个函数分别对应参数法的 lm() 线性回归、 aov() 方差分析。主要格式上的区别是添加了 perm= 参数。可以为Exact(精确模式)、Prob(不断从可能的序列中抽样,直至估计的标准差在估计的p值0.1之下)、SPR(使用贯序概率比检验来判断何时停止抽样)。值得注意的是当样本观测大于10,perm="Exact"自动默认转为"Prob",因此精确检验只适用于小样本问题。

(1)简单线性回归

实验示例仍为以身高预测体重的设计

(2)多项式回归

高精度拟合身高体重回归关系

(3)多元回归

探究谋杀率与多因素的回归关系

(1)单因素方差分析

(2)单因素协方差分析

实验示例仍为药物对刚出生小鼠体重影响,协变量为怀孕时间

(3)双因素方差分析(交互效应)

实验示例:两种药物分别在不同剂量下对小鼠牙齿长度的影响。

核心思想是有放回的抽样多次(1000次)

(1)写一个能返回带研究统计量的函数;

(2)确定重复数,使用 boot() 函数处理;(一般重复1000次即可;此外有人认为初始样本大小为20-30即可得到足够好的结果);

(3) boot.ci() 函数计算统计量置信区间。

实验示例:使用mtcar数据框,采用多元回归,根据车重和发动机排量来预测汽车的每加仑行驶的英里数。想获得95%的R平方值(预测变量对响应变量可解释的方差比)的置信区间

(1)首先写函数

(2)然后使用boot()函数

(3)最后boot.ci()函数求置信区间

实验示例:使用mtcar数据框,采用多元回归,根据车总和发动机排量来预测汽车的每加仑行驶的英里数。想获取一个统计量向量--三个回归系数(截距项、车总、发动机排量)95%的置信区间。

R语言 cov(a)函数返回的结果Population、Income、Illiteracy、LifeExp、Murder 、HSGrad分别是数据集“a"里的变量名称啊,要知道是什么意思,你需要去查看数据说明。