多元统计分析及r语言建模第五版课后的数据从哪找

Python028

多元统计分析及r语言建模第五版课后的数据从哪找,第1张

library(openxlsx) #加载读取Excel数据

#【输出设置】

#setwd("C:/Users/lst89/Documents/mvexer5") #设置目录

options(digits=4)

par(mar=c(4,4,2,1))

#第二章p57-2-1

R=matrix(c(1,0.8,0.26,0.67,0.34,0.8,1,0.33,0.59,0.34,0.26,0.33,1,0.37,0.21,0.67,0.59,0.37,1,0.35,0.34,0.34,0.21,0.35,1),nrow = 5,ncol = 5)

R #输入数据

solve(R) #求逆矩阵

R.e=eigen(R,symmetric=T) #symmetric是判断是否为对称阵,

R.e #求矩阵的特诊值

R.e $ vectors%*%diag(R.e $ values)%*%t(R.e $ vectors)#特征向量

#第二章p57-2-2

library(openxlsx) #加载读取Excel数据包

E2.2=read.xlsx('mvexer5.xlsx','E2.2')

E2.2 #读取mvexer5.xlsx表格E2.2数据

breaks = seq(0,3000,by = 300) #按组距为300编制频数表

breaks

hist(E2.2 $ X,breaks,col = 1:7,xlab = "工资(元)",ylab = "频数")#以工资x为横轴,频数y为纵轴,将数据划分为0-3000并以300为度量,绘制7列的彩色直方图

hist(E2.2 $ X ,breaks,freq = F,col = 1:7,xlab = "工资(元)",ylab = "频率")

Cumsum <- cumsum(E2.2 $ X)

cumsum

M <- seq(0,96000,by = 3000)

hist(Cumsum,M,freq = F,col = 1:12,las = 3,xlab = "工资(元)",ylab = "累积频率")#绘制出累计频率直方图

H = hist(E2.2 $ X,breaks = seq(900,3000,300))#正态概率图

names(H)

data.frame('组中距' = H $ mids,'频数' = H $ counts,'频率' = H $ density*300,'累积频率' = cumsum(H $ density*300))#

#第二章p57-2-3

library(openxlsx) #加载读取Excel数据包

E2.3=read.xlsx('mvexer5.xlsx','E2.3')

E2.3#读取mvexer5.xlsx表格E2.2数据

str(E2.3)

summary(E2.3)#对数据进行基本统计分析

#第三章P84-2.1

library(openxlsx)

E3.2 = read.xlsx('mvexer5.xlsx',sheet = 'E3.2',rowNames = TRUE)

#设定参数rowNames=TRUE,即可将第一列字符变量变成数据框的行名,供后期使用

E3.2

#在Excel文件中mvexer5.xlsx的表单d3.2中选择A1:E22,并复制到剪切板

dat = read.table("clipboard",header = T) #将剪切板数据读入数据框dat中

dat

#数据框标记转换函数

msa.X <- function(df){ #将数据框第一列设置为数据框行名

X = df[,-1] #删除数据框df的第一列并赋给X

rownames(X) = df[,1] #将df的第一列值赋给X的行名

X #返回新的数值数据框=return(X)

}

E3.2 = msa.X(dat)

E3.2

barplot(apply(E3.2,2,mean)) #按行作均值条形图

barplot(apply(E3.2,1,mean),las = 3) #修改横坐标标记

barplot(apply(E3.2,2,mean)) #按列作均值条图

barplot(apply(E3.2,2,median)) #按列作中位数条图

barplot(apply(E3.2,2,median),col = 1:8) #按列取色

boxplot(E3.2)#按列作箱尾图

boxplot(E3.2,horizontal = T) #箱尾图中图形按水平放置

#四p119-2-1

library(openxlsx) #加载读取Excel数据包

E4.1=read.table("clipboard",header = T)

E4.1

plot(x,y,main = '散点图',xlab = '每周加班时间(小时)',ylab = '每周签发的新保单数目(张)') #绘制散点图

cor(E4.1) #相关系数

lm4.1 <- lm(E4.1)

lm4.1

#估计值

square_sigma <- t(E4.1)/(10-1-1)#square_sigma <- t(x_hat - y)%*%(x_hat - y)/(10-1-1)

square_sigma

y = c(3.5,1,4,2,1,3,4.5,1.5,3,5)

x = c(825,215,1070,550,480,920,1350,325,670,1215)

y_hat <- 46.15 + 251.17*y

s <- t(y_hat - x)%*%(y_hat - x)/(10-1-1)

s

(summary(lm4.1) $ s)^2

#求方差分析

SR <- t(y_hat - mean(x))%*%(y_hat - mean(x))

ST <- t(x - mean(x))%*%(x - mean(x))

s_R <- SR/ST

s_R

(summary(lm4.1) $ r.squared)

anova(lm4.1)

#对回归方程作残差图分析

res <- residuals(lm4.1)

res

plot(y,res,main='残差散点图',xlab='每周签发的新保单数目',ylab='残差')

plot(lm4.1)

#计算1000张要加班的时间

lm4.1_1 <- lm(x ~ y,data = ee4.1)

predict(lm4.1_1,newdata = data.frame(y = 1000))

lm4.1_1 <- lm(y ~ x,data = ee4.1)

predict(lm4.1_1,newdata = data.frame(x = 1000))

#四p119-2-2

library(openxlsx)

E4.2 = read.xlsx('mvexer5.xlsx',sheet = 'E4.2',rowNames = T)

(lm4.2 = lm(y ~ x1 + x2,data = E4.2)) #显示多元线性回归模型

xlsx包不是R语言自带的包,必须额外安装xlsx包的依赖包也得安装,依赖包装好了才能加载xlsx包。

电脑:华为MateBook14

系统:Windows10

软件:1.0R语言、xlsx包

1、首先,导入R语言需要加载xlsx包,没有安装这个包的,请用下面的代码进行在线安装:

install.packages("xlsx"),选择China的任意一个镜像站点,它会自动安装其他所需的依赖包。

2、安装好xlsx包后,接下来导入存放在“C:\Users\HWT\Desktop”路径下的“test.xlsx”文件,导入这个文件的代码如下library(xlsx)

read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)。

3、我们上面的代码只是把test.xlsx导入了R语言,并没有把它赋给R语言里的某个对象,用下面的代码把数据赋给对象Mydata:

Mydata<-read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)。

4、那么如何查看Mydata里面的数据呢?只需要输入“Mydata”即可。

5、接下来教大家导入xls格式的数据,其实这个很简单,只要把前面代码的xlsx改为xls就可以了,

read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xls",sheetIndex=1)。

就我周围形势来看,计算机和软件毕业出来的学生就业形势在当前局势下基本没什么差别,两者就业形势都不错。其中软件的学生读研时都不会很明确的研究方向,学院一般组织学生参加工程实践,实习时的工作内容基本决定了以后的方向,毕业时基本就有有一年左右的工作经验了,找工作还是很有优势的。计算机的一般是跟着老板做事情,看个人情况吧,老板好的可以学到很多,不好的也就是混下来了。个人觉得哪个专业都可以,主要看个人努力了。

我自己是软件的研究生,第一年在校学习,第二年在公司做通讯终端设备的软件研发,即将毕业,工作已定,在周围同学里算一般吧,去中兴通讯,有问题可以直接咨询我

楼下的情况倒是很特殊啊,软件也没这么差吧,读研期间我工资也是5k多些。而且周围同学工作一般找的没有低于6k的,当然硬件的后期可能更好。

______________________________________________________________________

软件很难学 而且是青春饭 30岁没有什么成果就赚不到钱 而且普通的程序员也就是死工资 在长春每个月也就1500 沈阳每个月2000 南方每个月3000(前提是学的很精明) 我是学软件的 今年毕业 感觉学成的很少,找工作也不是很好找,都想改行了。所以我建议你学电子类 机械类 设计类 这些是真本事 而且容易上手 尤其是艺术设计。看你自己的想法了,个人观点学硬件比软件更容易,而且也掌握了技术,比较长久的选择,软件过时太快了。