R语言分组箱线图添加显著性标记简单小例子最终出图如下 这里自动做统计检验的函数是stat_compare_means()读入数据 作图 这个函数来自于ggpubr这个包,只需要指定根据那一列来分组就可以了 默认的是Wilcoxon Rank Sum2023-02-24Python130
R语言相关性检验函数2021.3.11得出相关系数我们并不一定能得出数据之间的相关水平,这时候我们会进行相关性检验来进行量化。 置信区间:confidence interval,是指由由样本统计量所构成的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某2023-02-24Python140
R语言做聚类分析用统计量确定类的个数.有什么代码或者包吗聚类分析有两种主要计算方法,分别是凝聚层次聚类(Agglomerative hierarchical method)和K均值聚类(K-Means)。层次聚类又称为系统聚类,首先要定义样本之间的距离关系,距离较近的归为一类,较远的则属于不同的2023-02-24Python170
R语言进行ssGSEA分析先加载相关的package 然后提取想要的基因集,变成list 然后进行富集分析 需要注意的点: 1.expr输入的表达矩阵必须为:SummarizedExperiment或者SingleCellExperiment Exp2023-02-24Python190
R语言与统计-1:t检验与秩和检验一般根据数据是否符合正态分布,选择合适的统计方法: T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。t检验是用t分布理2023-02-24Python210
如何求一年的月人均生产量建议用出勤表统计每个人的上班数.按21班为1个月,得R.DR表示每人每月的平均产量。(D1+D2+D3)(R1+R2+R3)表示一季度每人每月平均生产量。 你可以在载入的时候就把这个问题解决。比如,如果是.xlsx的数据,用read.x2023-02-24Python230
R 单独窗口显示绘图(plots)R语言绘图,如果能够想图中所展示的一样,能够独立窗口显示绘图。既方便查看又方便保存。 由于一不小心卸载了RStudio,重新安装之后。以前能够在独立窗口显示绘图的功能,现在怎么都找不回了。 而百度的结果刚好跟我相反。他们都是出现了独2023-02-24Python490
求生物统计学大神!首先要知道这是用什么统计方法。这个题目抽象来说是判断连续型变量均值是否等于一个总体均值,因此首先想到的是t检验。因为这里不太方便打公式,我用R语言表达公式假设所有数据在向量x里面x=c(39,...,41)1.计算样本的均值a=mean(x2023-02-24Python240
R语言绘制配对样品箱线图配对箱线图,常见于配对样本的数据分析中。 例如下图示例,为了研究某些基因在肿瘤组织和正常组织中是否具有表达量的显著不同,在取样时,往往会在同一患者个体中同时获取肿瘤和临近正常组织,两个组织样本就是配对关系。当然在这类研究中,往往需要调查2023-02-24Python210
R语言|PLS-DA分析绘图示例偏最小二乘法判别分析(PLS_DA)是一种用于判别分析的多变量统计分析方法,一种根据观察或测量到的若干变量值,来判断研究对象如何分类的常用统计分析方法。对不同处理样本(如观测样本、对照样本)的特性分别进行训练,产生训练集,并检验训练集的可信2023-02-24Python260
【R语言入门与数据分析-5】 数据分析实战老师的吐槽大会,乐死我了。hhh regression,通常指用一个或者多个预测变量,也称自变量或者解释变量,来预测响应变量,也称为因变量、效标变量或者结果变量的方法 存在多个变量 AIC 考虑模型统计拟合度、用来拟合的参数数目2023-02-24Python130
《R语言实战》自学笔记44-t检验数据准备t检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n <30),总体标准差σ未知的正态分布。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均2023-02-24Python160
R语言-T检验、秩和检验、百分比检验、卡方检验T检验:符合正态分布的数据用T检验 秩和检验:不满足正态分布的数据用秩和检验 正态分布的检验 非正态分布 非正态分布中值比均值有意义 如果点在直线两侧则为正态分布。图示为非正态分布 wilcox.test(变量1,变2023-02-24Python160
R语言学习之决策树R语言学习之决策树决策树最重要的2个问题:决策树的生长问题,决策树的剪枝问题。生长问题又包括了2个子问题:从分组变量的众多取值中选择一个最佳分割点和从众多输入变量中选择当前最佳分组变量;剪枝问题包括2个子问题:预修剪(事先指定树的最大深度,2023-02-24Python140
R语言-KNN算法1、K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本2023-02-24Python150
R语言入门--第十四节(聚类分析)(1)定义每一个观测值为一类; (2)计算每一类和其它各类的距离; (3)把“距离”最短的两类合并成一类,这样类的个数就减少一个; (4)重复步骤1和步骤2,直到包含所有观测值的类合并成单个类为止。 基于5种营养标准含量(变2023-02-24Python200
R语言|绘制物种累计曲线物种累积曲线( species accumulation curves)用于衡量和预测群落中物种丰富度随样本量扩大而增加的幅度,在生物多样性和群落调查中,被广泛用于判断样本量是否充分的并估计群落丰富度。 一般而言,在样本量较少的情况下,2023-02-24Python120
R语言|绘制物种累计曲线物种累积曲线( species accumulation curves)用于衡量和预测群落中物种丰富度随样本量扩大而增加的幅度,在生物多样性和群落调查中,被广泛用于判断样本量是否充分的并估计群落丰富度。 一般而言,在样本量较少的情况下,2023-02-24Python220
在R语言中,只已知2个样本各自的个数,均值,方差,怎么检验差异是否显著?如果两个样本具有方差齐性,那么做独立样本t检验时,直接套用t检验的公式,计算t值,,查表的自由度为n1+n2-2,然后用函数pt( t value, n1+n2-2)给出p值,小于0.05即为显著。如果方差不齐,需要计算校正后的自由度,2023-02-24Python140
如何用R语言进行相关系数与多变量的meta分析本文第一大部分将介绍用R软件的meta分析数据包实现相关系数的Meta分析,第二大部分如何用R语言进行多变量的meta分析。 想获取R语言相关系数meta分析的程序模板的同学请在公众号(全哥的学习生涯)内回复“相关系数”即可。 me2023-02-24Python170