R语言相关性检验函数2021.3.11

R语言相关性检验函数2021.3.11

得出相关系数我们并不一定能得出数据之间的相关水平,这时候我们会进行相关性检验来进行量化。 置信区间:confidence interval,是指由由样本统计量所构成的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某
Python140
R语言进行ssGSEA分析

R语言进行ssGSEA分析

先加载相关的package 然后提取想要的基因集,变成list 然后进行富集分析 需要注意的点: 1.expr输入的表达矩阵必须为:SummarizedExperiment或者SingleCellExperiment Exp
Python190
R语言与统计-1:t检验与秩和检验

R语言与统计-1:t检验与秩和检验

一般根据数据是否符合正态分布,选择合适的统计方法: T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n&lt30),总体标准差σ未知的正态分布资料。t检验是用t分布理
Python210
如何求一年的月人均生产量

如何求一年的月人均生产量

建议用出勤表统计每个人的上班数.按21班为1个月,得R.DR表示每人每月的平均产量。(D1+D2+D3)(R1+R2+R3)表示一季度每人每月平均生产量。 你可以在载入的时候就把这个问题解决。比如,如果是.xlsx的数据,用read.x
Python230
R 单独窗口显示绘图(plots)

R 单独窗口显示绘图(plots)

R语言绘图,如果能够想图中所展示的一样,能够独立窗口显示绘图。既方便查看又方便保存。 由于一不小心卸载了RStudio,重新安装之后。以前能够在独立窗口显示绘图的功能,现在怎么都找不回了。 而百度的结果刚好跟我相反。他们都是出现了独
Python490
求生物统计学大神!

求生物统计学大神!

首先要知道这是用什么统计方法。这个题目抽象来说是判断连续型变量均值是否等于一个总体均值,因此首先想到的是t检验。因为这里不太方便打公式,我用R语言表达公式假设所有数据在向量x里面x=c(39,...,41)1.计算样本的均值a=mean(x
Python240
R语言绘制配对样品箱线图

R语言绘制配对样品箱线图

配对箱线图,常见于配对样本的数据分析中。 例如下图示例,为了研究某些基因在肿瘤组织和正常组织中是否具有表达量的显著不同,在取样时,往往会在同一患者个体中同时获取肿瘤和临近正常组织,两个组织样本就是配对关系。当然在这类研究中,往往需要调查
Python210
R语言|PLS-DA分析绘图示例

R语言|PLS-DA分析绘图示例

偏最小二乘法判别分析(PLS_DA)是一种用于判别分析的多变量统计分析方法,一种根据观察或测量到的若干变量值,来判断研究对象如何分类的常用统计分析方法。对不同处理样本(如观测样本、对照样本)的特性分别进行训练,产生训练集,并检验训练集的可信
Python260
【R语言入门与数据分析-5】 数据分析实战

【R语言入门与数据分析-5】 数据分析实战

老师的吐槽大会,乐死我了。hhh regression,通常指用一个或者多个预测变量,也称自变量或者解释变量,来预测响应变量,也称为因变量、效标变量或者结果变量的方法 存在多个变量 AIC 考虑模型统计拟合度、用来拟合的参数数目
Python130
《R语言实战》自学笔记44-t检验

《R语言实战》自学笔记44-t检验

数据准备t检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n &lt30),总体标准差σ未知的正态分布。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均
Python160
R语言-T检验、秩和检验、百分比检验、卡方检验

R语言-T检验、秩和检验、百分比检验、卡方检验

T检验:符合正态分布的数据用T检验 秩和检验:不满足正态分布的数据用秩和检验 正态分布的检验 非正态分布 非正态分布中值比均值有意义 如果点在直线两侧则为正态分布。图示为非正态分布 wilcox.test(变量1,变
Python160
R语言学习之决策树

R语言学习之决策树

R语言学习之决策树决策树最重要的2个问题:决策树的生长问题,决策树的剪枝问题。生长问题又包括了2个子问题:从分组变量的众多取值中选择一个最佳分割点和从众多输入变量中选择当前最佳分组变量;剪枝问题包括2个子问题:预修剪(事先指定树的最大深度,
Python140
R语言-KNN算法

R语言-KNN算法

1、K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本
Python150
R语言入门--第十四节(聚类分析)

R语言入门--第十四节(聚类分析)

(1)定义每一个观测值为一类; (2)计算每一类和其它各类的距离; (3)把“距离”最短的两类合并成一类,这样类的个数就减少一个; (4)重复步骤1和步骤2,直到包含所有观测值的类合并成单个类为止。 基于5种营养标准含量(变
Python200
R语言|绘制物种累计曲线

R语言|绘制物种累计曲线

物种累积曲线( species accumulation curves)用于衡量和预测群落中物种丰富度随样本量扩大而增加的幅度,在生物多样性和群落调查中,被广泛用于判断样本量是否充分的并估计群落丰富度。 一般而言,在样本量较少的情况下,
Python120
R语言|绘制物种累计曲线

R语言|绘制物种累计曲线

物种累积曲线( species accumulation curves)用于衡量和预测群落中物种丰富度随样本量扩大而增加的幅度,在生物多样性和群落调查中,被广泛用于判断样本量是否充分的并估计群落丰富度。 一般而言,在样本量较少的情况下,
Python220
如何用R语言进行相关系数与多变量的meta分析

如何用R语言进行相关系数与多变量的meta分析

本文第一大部分将介绍用R软件的meta分析数据包实现相关系数的Meta分析,第二大部分如何用R语言进行多变量的meta分析。 想获取R语言相关系数meta分析的程序模板的同学请在公众号(全哥的学习生涯)内回复“相关系数”即可。 me
Python170