模糊C均值聚类算法(FCM)

模糊C均值聚类算法(FCM)

【嵌牛导读】FCM算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。模糊C均值算法是普通C均值算法的改进,普通C均值算法对于数据的划分是硬性的,而FCM则是一种柔性的模糊划分。【嵌牛
Python190
R语言之书笔记:常见的概率分布

R语言之书笔记:常见的概率分布

两种可能结果的离散随机变量概率分布 ,失败是0,成功是1,p是成功的概率。dbinorm() :提供任何有效x的概率质量函数pbinom() :提供累积概率分布,求结果成功q次及q次以下的累积概率,给定分位数值q,输出累
Python130
什么是检验效能?如何提高检验效能?

什么是检验效能?如何提高检验效能?

 检验效能或把握度,是指两总体确有差别,按β水准能发现它们有差别的能力。用1-β表示其概率大小。rn 检验效能的大小主要与以下四个因素有关。rn(1)总体差别的大小:正确选择被试因素及其水平,这是实验成败的首要环节。被试因素的有效性
Python200
如何用R语言进行相关系数与多变量的meta分析

如何用R语言进行相关系数与多变量的meta分析

本文第一大部分将介绍用R软件的meta分析数据包实现相关系数的Meta分析,第二大部分如何用R语言进行多变量的meta分析。 想获取R语言相关系数meta分析的程序模板的同学请在公众号(全哥的学习生涯)内回复“相关系数”即可。 me
Python280
R语言中 fitted和predict的区别

R语言中 fitted和predict的区别

简单的说,fitted是拟合值,predict是预测值:所做的模型是基于给定样本的值建立的,在这些给定样本x1,x2,...,xn(已知所对应的y值)上做预测就是拟合;在新样本上xn+1,xn+2,...(y值未知)做预测,就是模型预测。
Python150
R语言-KNN算法

R语言-KNN算法

1、K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本
Python240
R语言中有哪些包可以处理批次效应

R语言中有哪些包可以处理批次效应

可以用sva包处理,R sva包去除批次效应(batch effect)标签:batch-effectr生物信息学前言:sva包可以去除高通量实验中的批次效应和其它一些无关变量带来的影响。分为两个步骤:1.鉴定和评估实验中潜在的影响变量;2
Python210
《R语言实战》自学笔记69-重抽样和自助法

《R语言实战》自学笔记69-重抽样和自助法

数据准备 许多实际情况中统计假设(假定观测数据抽样自正态分布或者其他性质较好的理论分布)并不一定满足,比如数据抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,这时基于随机化和
Python150
AIC和BIC准则

AIC和BIC准则

很多参数估计问题均采用似然函数作为目标函数,当训练数据足够多时,可以不断提高模型精度,但是以提高模型复杂度为代价的,同时带来一个机器学习中非常普遍的问题——过拟合。 所以, 模型选择问题 在 模型复杂度 与 模型对数据集描述能力 (即似
Python190
基于R语言的分类、聚类研究

基于R语言的分类、聚类研究

1.所有在对iris数据集分(聚)类研究中,setosa均可以完全正确分(聚)类,而另外两类则会出现不同程度的误差,这也是导致整个研究模型出现误差的原因; 2.在使用的三种分类研究方法中,决策树模型的效果最优,因此可以使用该方法进行鸢尾
Python170
r语言如何数据分析

r语言如何数据分析

r语言数据分析是查看数据的结构、类型,数据处理。根据查询相关资料信息显示:R语言是一个开源、跨平台的科学计算和统计分析软件包,具有丰富多样、强大的的统计功能和数据分析功能,数据可视化可以绘制直方图、箱型图、小提琴图等展示分数的分布情况可以通
Python200
R语言作业-统计30题

R语言作业-统计30题

链接: http:www.bio-info-trainee.com4385.html我做题的时候主要翻阅学习了《R语言实战》里统计相关内容。 需要掌握R内置数据集及R包数据集 鸢尾花(iris)数据集,包含150个鸢尾
Python160
Pipline Model--实体关系抽取<总结>

Pipline Model--实体关系抽取<总结>

数据集是关于医疗诊断的,json格式存储,一个样本如下,分别包含text和spo_list,spo_list包含一个或多个对象。spo_list里的predicate是要提取的关系,subject是头实体,object是尾实体。 数据量
Python200
r语言中的var函数是什么意思

r语言中的var函数是什么意思

c语言中函数var是什么意思?函数var假定其参数是样本总体中的样本。如果数据是样本总体,则应使用VarP函数计算方差。意义:根据给定的样本计算方差。语法:VAR(Number1,number2,…)Number1,number2,。。。是
Python270