R语言分组箱线图添加显著性标记简单小例子

2023-02-24 21:30:01Python023

R语言分组箱线图添加显著性标记简单小例子,第1张

最终出图如下

这里自动做统计检验的函数是 stat_compare_means()

读入数据

作图

这个函数来自于ggpubr这个包，只需要指定根据那一列来分组就可以了

默认的是Wilcoxon Rank Sum and Signed Rank Tests，如果要用t检验指定method参数

如果想把P值改成星号，直接加label=“p.signif”参数

这里如果不显著会在图上显示ns，如果不想要ns，可以加 hide.ns = TRUE 参数

星号的位置可以手动指定，用 label.y = c(26,31) 参数

使用到的是 ggsignif 这个包

小明的数据分析笔记本

先把整个数据读进来，比如赋值给data。data第一列是A1,A2什么的。 A<-as.matrix(data[grep("A",data[,1]),-1])B<-as.matrix(data[grep("B",data[,1]),-1])correlation.matrix<-matrix(nrow=nrow(A),ncol=nrow(B))for(i in 1:nrow(A)) for(j in 1:nrow(B)) correlation.matrix[i,j]<-cor(A[i,],B[j,]) 结果就在correlation.matrix里了

相关性分析是指对两个或多个具备相关性的变量元素进行分析，从而衡量两个变量因素的相关密切程度。相关性分析旨在研究两个或两个以上随机变量之间相互依存关系的方向和密切程度。

一般来讲研究对象（样品或处理组）之间使用距离分析，而元素（物种或环境因子）之间进行相关性分析 。两个变量之间的相关性可以用简单相关系数（例如皮尔森相关系数等）进行表示，相关系数越接近1，两个元素相关性越大，相关系数越接近0，两个元素越独立。

Pearson相关系数是用于表示相关性大小的最常用指标，数值介于-1~1之间，越接近0相关性越低，越接近-1或1相关性越高。正负号表明相关方向，正号为正相关、负号为负相关。适用于两个正态分布的连续变量。

利用两变量的秩次大小来进行分析，属于非参数统计方法。适用于不满足Pearson相关系数正态分布要求的连续变量。也可以用于有序分类变量的之间的相关性测量。

Kendall's Tau相关系数是一种非参数检验，适用于两个有序分类变量。

此外衡量两个变量之间关系的方法还有：卡方检验、Fisher精确检验等。

Pearson、Spearman、Kendall相关系数都可以通过cor函数实现，cov协方差函数参数同cor函数。

ggcorrplot包内只有2个函数，一个cor_pmat()用于计算p值，一个ggcorrplot()用于绘图。ggcorrplot相当于精简版的corrplot包，只有主题更加丰富多样。

This function computes and returns the distance matrix computed by using the specified distance measure to compute the distances between the rows of a data matrix.

这个函数用特定的方法计算矩阵的行之间的距离，并返回距离矩阵。

scale是对矩阵的每一列进行标准化，如果要对行标准化需要先转置。如 heatmapdata <- t(scale(t(heatmapdata)))