《R语言实战》自学笔记69-重抽样和自助法

《R语言实战》自学笔记69-重抽样和自助法

数据准备 许多实际情况中统计假设(假定观测数据抽样自正态分布或者其他性质较好的理论分布)并不一定满足,比如数据抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,这时基于随机化和
Python200
R语言:十一个统计检验都在这了

R语言:十一个统计检验都在这了

R语言的各种检验 1、W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验) 检验数据是否符合正态分布,R函数:shapiro.test(). 结果含义:当p值小于某个显著性水平α(比如0.05)时,则认为
Python140
R语言Knn算法中的训练集和测试集必须各占一半吗

R语言Knn算法中的训练集和测试集必须各占一半吗

这个不一定。之所以要分训练集和测试集是因为怕过度拟合(overfitting),所以需要一个测试集来检验确定 你建立的模型并不只是适合于这一组数据。我一般都是70%训练集30%测试集。当然,得看数据量有多大,以及复杂程度。只要训练集&
Python210
t检验算法及其在R语言中的实现

t检验算法及其在R语言中的实现

在进行t检验之前让我们先看看它的定义: t检验法就是在假设检验时利用 t分布 进行概率计算的检验方法。那问题来了,什么是t分布呢? 所以我们在进行t检验之前,应该对数据进行 正态性检验 以及 方差齐性
Python150
如何使用R语言进行正态性检验

如何使用R语言进行正态性检验

卡方拟合优度检验或者正态性检验都可以检验一串数据是否服从正态分布。如果你用spss里面就有正态性检验QQ图PP图如果你用R就用shapiro.testkolmogorov-smirnov非参数检验K-S检验如果你用matlab就是normp
Python150
建议收藏!10 种 Python 聚类算法完整操作示例

建议收藏!10 种 Python 聚类算法完整操作示例

K均值聚类 K-Means算法思想简单,效果却很好,是最有名的聚类算法。聚类算法的步骤如下: 1:初始化K个样本作为初始聚类中心; 2:计算每个样本点到K个中心的距离,选择最近的中心作为其分类,直到所有样本点分类完毕
Python170
R语言与统计-1:t检验与秩和检验

R语言与统计-1:t检验与秩和检验

一般根据数据是否符合正态分布,选择合适的统计方法: T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n&lt30),总体标准差σ未知的正态分布资料。t检验是用t分布理
Python140
R语言-KNN算法

R语言-KNN算法

1、K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本
Python210
R语言-KNN算法

R语言-KNN算法

1、K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本
Python380
利用Python进行t检验

利用Python进行t检验

t检验主要用于检验计量资料(连续变量)的两组均值是否存在差异 无论是哪种t检验,都有以下的基本前提条件: 检验步骤: 各t检验的应用场景t检验应用: 1、单样本检验: 2、样本检验 3、对t检验 4、独立样本t检
Python120
求助,r语言中的判别分析

求助,r语言中的判别分析

Fisher判别分析,即 LDA 相应的R实现为:MASS包中的 lad() 函数,qda() 函数lad(x, grouping, prior = proportions ,tol = 1.0e-4, method , CV = FALS
Python120
《R语言实战》自学笔记69-重抽样和自助法

《R语言实战》自学笔记69-重抽样和自助法

数据准备 许多实际情况中统计假设(假定观测数据抽样自正态分布或者其他性质较好的理论分布)并不一定满足,比如数据抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,这时基于随机化和
Python50
r语言bpinom函数怎么使用

r语言bpinom函数怎么使用

r语言中bpinom函数的基本用法为:pbinom(x,size,,prob),该函数为事件的累积概率,它用于表示概率的单个值。例如:抛掷硬币100次,正面向上不超过50次的概率,即pbinom(50,100,0.5)。r语言有四个内置函数
Python170