《R语言实战》自学笔记69-重抽样和自助法

《R语言实战》自学笔记69-重抽样和自助法

数据准备 许多实际情况中统计假设(假定观测数据抽样自正态分布或者其他性质较好的理论分布)并不一定满足,比如数据抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,这时基于随机化和
Python150
R语言|绘制NMDS图

R语言|绘制NMDS图

非度量多维标度(NMDS)分析 非度量多维标度(Non-metric Multidimensional Scaling,NMDS)是一种将多维空间的研究对象(样本或变量)简化到低维空间进行定位、分析和归类,同时又保留对象间原始关系的数据
Python110
R语言-KNN算法

R语言-KNN算法

1、K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本
Python100
R语言画茎叶图函数是什么?

R语言画茎叶图函数是什么?

R语言是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R语言画茎叶图函数就是用R语言里的函数stem来画茎叶图。茎叶图也叫枝叶图,是在20世纪早期由英国
Python120
R如何找热图中的离群值

R如何找热图中的离群值

可以通过三个方法找出离群值:1.单变量检测法2.双变量检测法3.多元模型检测法离群值 (outliers)是指在一份数据中,与其他观察值具有明显不同特征的那些观察值。然而,并没有一个明确的准则来判断哪些观察值属于“离群值”。这主要取决于多种
Python110
《R语言实战》自学笔记44-t检验

《R语言实战》自学笔记44-t检验

数据准备t检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n &lt30),总体标准差σ未知的正态分布。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均
Python190
(R语言)fit函数代表什么意思?

(R语言)fit函数代表什么意思?

包装函数,允许在相同的连贯函数结构下适应不同的数据挖掘方法。1、R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。2、R是统计领域广泛使用的诞生于19
Python140
r语言var是什么意思

r语言var是什么意思

是指向量自回归模型。VAR是计量经济学中的一个概念,用于多元时间序列相关关系的分析。计算机语言中的var:Pascal:var在Pascal作为程序的保留字,用于定义变量。如:vara:integer,定义变量a,类型为整数varu:arr
Python180
r语言arimax函数怎么预测

r语言arimax函数怎么预测

举一个例子吧,比如月度的数据,就是周期为12,它有季节影响。先对其1阶12步差分,通过看acfpac f看是简单加法模型,还是乘法季节模型如果是乘法模型那就要对季节部分模拟arima模型 季节部分的arima是以周期位置的acf pac
Python110
xgboost的python包有多少参数

xgboost的python包有多少参数

XGBoost参数XGBoost的参数可以分为三种类型:通用参数、booster参数以及学习目标参数General parameters:参数控制在提升(boosting)过程中使用哪种booster,常用的booster有树模型(tre
Python150
R语言实现bootstrap和jackknife检验方法

R语言实现bootstrap和jackknife检验方法

写在最前面: 首先需要说一下,本文的bootstrap和jackknife都算是蒙特卡罗方法(Monte Carlo method)的一种。应用广泛的的MCMC链(马尔可夫链蒙特卡洛方法Markov chain Monte Carlo
Python170
R语言-KNN算法

R语言-KNN算法

1、K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本
Python130
R语言-T检验、秩和检验、百分比检验、卡方检验

R语言-T检验、秩和检验、百分比检验、卡方检验

T检验:符合正态分布的数据用T检验 秩和检验:不满足正态分布的数据用秩和检验 正态分布的检验 非正态分布 非正态分布中值比均值有意义 如果点在直线两侧则为正态分布。图示为非正态分布 wilcox.test(变量1,变
Python100
R语言实现bootstrap和jackknife检验方法

R语言实现bootstrap和jackknife检验方法

写在最前面: 首先需要说一下,本文的bootstrap和jackknife都算是蒙特卡罗方法(Monte Carlo method)的一种。应用广泛的的MCMC链(马尔可夫链蒙特卡洛方法Markov chain Monte Carlo
Python120
r语言 da[,2]函数,是什么意思?怎么理解?

r语言 da[,2]函数,是什么意思?怎么理解?

这个表示选取da这个元素(可能是矩阵,也可能是数据框)中第二列的所有元素。如果想选取第一行的,就是 da[1, ],想选取第一行第二列的就是 da[1, 2]偏最小二乘法判别分析(PLS_DA)是一种用于判别分析的多变量统计分析方法,一种根
Python90
数学建模中有人用R语言吗

数学建模中有人用R语言吗

一般与统计学相关的建模,R语言就肯定有人用。例如时间序列arima,多元时间序列VAR, VEC,ETS, ESM等等。因为R是统计学家设计的开源代码。另外机器学习的模型也有,例如SVM,随机森林,神经网络,R都可以做一些。当然,简单的线性
Python130
如何在R语言中使用Logistic回归模型

如何在R语言中使用Logistic回归模型

Logistic回归在做风险评估时,一般采用二值逻辑斯蒂回归(Binary Logistic Regression)。以滑坡灾害风险评估为例。1、滑坡发生与否分别用0和1表示(1表示风险发生,0表示风险未发生);2、确定影响滑坡风险的影响因
Python90