R语言可视化之ggplot2——KEGG通路富集分析

R语言可视化之ggplot2——KEGG通路富集分析

之前分享了如何用ggplot2可视化GO分析的结果。既然做了GO,当然少不了KEGG了。 同样的,我们从 DAVID 获取KEGG pathway的结果。 对于KEGG,我比较喜欢做气泡图,这样用两种形式的图结合在一起,效果更丰富更
Python160
R语言计算方差

R语言计算方差

nrow(leadership)是leadership这个数据集的行数(可能就是样本数),1:nrow(leadership) 是一个向量,从1到nrow(leadership),sample(1:nrow(leadership)) 是将里
Python160
什么是r检验

什么是r检验

r实验指的是科学研究的基本方法之一。根据科学研究的目的,尽可能地排除外界的影响,突出主要因素并利用一些专门的仪器设备,而人为地变革、控制或模拟研究对象,使某一些事物(或过程)发生或再现,从而去认识自然现象、自然性质、自然规律。科学实验,是指
Python200
r语言中pt函数的用法

r语言中pt函数的用法

R语言t分布(不同自由度).了解r语言几个函数:dt,pt,qt,rt分别与dnorm,rnorm,pnorm,qnorm和rnorm对应&gt*dt()的返回值是正态分布概率密度函数。R语言本身提供了很多的内置函数,当然我们也可以
Python170
如何用r语言写协方差矩阵的迭代

如何用r语言写协方差矩阵的迭代

协方差矩阵计算用公式cov(x,y)=EXY-EX*EY。在数学中,矩阵是一个按照长方阵列排列的复数或实数集合,最早来自于方程组的系数及常数所构成的方阵。这一概念由19世纪英国数学家凯利首先提出。1、假设协方差矩阵为c第i行与du第j行的
Python260
如何用R语言求jackknife距离

如何用R语言求jackknife距离

这里给出以前写的一个示例。下面以使用刀切法估计正态分布N(0,25)的方差为例来说明刀切法的实现和优势。这里,我们将样本的修正方差视为关于总体方差的一个估计量。##1)产生随机变量x~N(0,25),产生100个样本set.seed(20
Python160
r语言 怎么求mallows cp统计量

r语言 怎么求mallows cp统计量

可以参考leaps包的regsubsets函数的帮助文档:http:127.0.0.1:21444libraryleapshtmlregsubsets.html将summary函数用在regsubsets()函数的结果上,返回值
Python120
R语言学习之决策树

R语言学习之决策树

R语言学习之决策树决策树最重要的2个问题:决策树的生长问题,决策树的剪枝问题。生长问题又包括了2个子问题:从分组变量的众多取值中选择一个最佳分割点和从众多输入变量中选择当前最佳分组变量;剪枝问题包括2个子问题:预修剪(事先指定树的最大深度,
Python400
R语言实现bootstrap和jackknife检验方法

R语言实现bootstrap和jackknife检验方法

写在最前面: 首先需要说一下,本文的bootstrap和jackknife都算是蒙特卡罗方法(Monte Carlo method)的一种。应用广泛的的MCMC链(马尔可夫链蒙特卡洛方法Markov chain Monte Carlo
Python150
R语言绘制配对样品箱线图

R语言绘制配对样品箱线图

配对箱线图,常见于配对样本的数据分析中。 例如下图示例,为了研究某些基因在肿瘤组织和正常组织中是否具有表达量的显著不同,在取样时,往往会在同一患者个体中同时获取肿瘤和临近正常组织,两个组织样本就是配对关系。当然在这类研究中,往往需要调查
Python310
R语言z-score转p.value

R语言z-score转p.value

z-score计算方法为: Z =(x-μ) σ μ为均值,σ为标准差。 以下是R中将z-score转为p.value的方法: pnorm(q, mean = 0, sd = 1, lower.tail = TRUE)
Python200
《R语言实战》自学笔记69-重抽样和自助法

《R语言实战》自学笔记69-重抽样和自助法

数据准备 许多实际情况中统计假设(假定观测数据抽样自正态分布或者其他性质较好的理论分布)并不一定满足,比如数据抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,这时基于随机化和
Python240
R语言可视化通路富集网络图

R语言可视化通路富集网络图

我们输入的数据包含 gene ID 和 vector(单样本)部分,这里的 gene ID 是一个通用概念,可以是基因、转录本、酶或蛋白质。这里的 vector 可以是样本的表达量、倍数变化, p-value, 组蛋白修饰数据等可测量的属
Python620
如何用R语言做线性相关回归分析

如何用R语言做线性相关回归分析

cor()函数可以提供双变量之间的相关系数,还可以用scatterplotMatrix()函数生成散点图矩阵不过R语言没有直接给出偏相关的函数;我们要是做的话,要先调用cor.test()对变量进行Pearson相关性分析,得到简单相关
Python160
R语言-KNN算法

R语言-KNN算法

1、K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本
Python150
r语言 plot设置刻度

r语言 plot设置刻度

解决这个问题的方法如下:1、首先在R中,plot函数作图时会自动给出xy轴的刻度标度。2、然后有时需要自己定义xy轴的刻度,这时可以用axis中的at和labels参数来更改,先令plot不要画出xy轴的标度。3、最后,用axis函数设置
Python590