【R语言】--- 箱型图

【R语言】--- 箱型图

箱线图主要是通过四分位数描述数据分布,通过最大值,上四分位数,中位数,下四分位数,最小值五处位置描述数据分布情况。箱线图能够显示出可能为离群点(范围±1.5*IQR以外的值,IQR表示四分位距,即上四分位数与下四分位数的差值)的观测。从箱线
Python180
t检验算法及其在R语言中的实现

t检验算法及其在R语言中的实现

在进行t检验之前让我们先看看它的定义: t检验法就是在假设检验时利用 t分布 进行概率计算的检验方法。那问题来了,什么是t分布呢? 所以我们在进行t检验之前,应该对数据进行 正态性检验 以及 方差齐性
Python150
R语言--不均衡问题处理

R语言--不均衡问题处理

样本不均衡问题是指在机器学习分类任务中,不同类型的样本占比差距悬殊。 比如训练数据有100个样本,其中只有5个正样本,其余均为负样本,这样正样本:负样本=5%:95%,训练数据中负样本过多,会导致模型无法充分学习到正样本的信息,这时候
Python180
R语言:十一个统计检验都在这了

R语言:十一个统计检验都在这了

R语言的各种检验 1、W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验) 检验数据是否符合正态分布,R函数:shapiro.test(). 结果含义:当p值小于某个显著性水平α(比如0.05)时,则认为
Python190
用R语言对vcf文件进行数据挖掘.11 CNV分析

用R语言对vcf文件进行数据挖掘.11 CNV分析

目录 在之前的文章里介绍了如何通过直方图来可视化等位杂合碱基的比例来判断物种的染色体倍数性。在本文里会继续向下挖掘,介绍如何可视化染色体上的拷贝数变化(CNVs)。 和前文一样的操作,使用包自带的数据。 我们需要去除过高和过低深
Python120
R语言ggcorrplot包绘制相关性热图

R语言ggcorrplot包绘制相关性热图

热图是科研论文中一种常见的可视化手段,而在转录组研究领域,我们常常需要分析一些基因与基因之间的相关性,来判断生物样本中是否存在共表达情况,以及共表达基因模块。除了基因集之间,其他方向,比如免疫细胞群体之间相关性,样本的相关性,也常常用相关性
Python200
怎么求聚集系数和平均度

怎么求聚集系数和平均度

按照图形理论,聚集系数是表示一个图形中节点聚集程度的系数,证据显示,在现实中的网络中,尤其是在特定的网络中,由于相对高密度连接点的关系,节点总是趋向于建立一组严密的组织关系。在现实世界的网络,这种可能性往往比两个节点之间随机设立了一个连接的
Python140
R语言是什么?

R语言是什么?

《R语言4.0.4软件》百度网盘资源免费下载:链接: https:pan.baidu.coms160twe4ScMvIbGm2TI_sjHw?pwd=3ts7 提取码: 3ts7R语言4.0.4是一款专业的统计建模软件,与其它建
Python140
R语言箱式图的制作代码

R语言箱式图的制作代码

#使用并列箱线图进行跨组比较,如图6-12#公式y~A*B则将为类别型变量A和B所有水平的两两组合生成数值型变量y的箱线图, 例子的mpg~cyl表示为四缸、六缸、八缸发动机对每加仑汽油行驶的英里数的影响。boxplot(mpg~cyl,d
Python160
K-MEANS算法的实现方法

K-MEANS算法的实现方法

补充一个Matlab实现方法:function [cid,nr,centers] = cskmeans(x,k,nc)% CSKMEANS K-Means clustering - general method.%% This implem
Python160
r语言S-W和K-S两种正态性检验

r语言S-W和K-S两种正态性检验

Shapiro-Wilk检验用来检验是否数据符合正态分布 ,类似于线性回归的方法一样,是检验其于回归曲线的残差。该方法作者推荐在样本量很小的时候使用,比如N&lt20。但是也有作者推荐在大数据集上使用。该作者将这种修改后的方
Python170
r语言求平均值

r语言求平均值

vec = vector(length =1000)for(i in 1:1000)    vec[i] = UR_FUNC()mean(vec)数据准备t检验,亦称student t检验(Student's t te
Python170
【R语言】--- 饼状图

【R语言】--- 饼状图

饼状图,又称为饼图,能够划分几个扇形的圆形统计图。可以描述量、频率、占比的相对关系。R语言中,可以用graphics包的pie()函数、ggplot2包的geom_bar()配合coord_polar()函数绘制,3D 的饼状图,可以使用
Python210
R语言绘制配对样品箱线图

R语言绘制配对样品箱线图

配对箱线图,常见于配对样本的数据分析中。 例如下图示例,为了研究某些基因在肿瘤组织和正常组织中是否具有表达量的显著不同,在取样时,往往会在同一患者个体中同时获取肿瘤和临近正常组织,两个组织样本就是配对关系。当然在这类研究中,往往需要调查
Python240