R语言与统计-1:t检验与秩和检验

R语言与统计-1:t检验与秩和检验

一般根据数据是否符合正态分布,选择合适的统计方法: T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n&lt30),总体标准差σ未知的正态分布资料。t检验是用t分布理
Python90
r语言arima模型预测怎样输入新数据

r语言arima模型预测怎样输入新数据

拟合序列我很喜欢forecast包的auto.arima()函数,输入序列,可以直接帮你定阶。预测可以分静态预测(多步样本外预测),动态预测(一步步样本外预测),每隔一段时间重新估计模型的预测。ARIMA有现成的东西 nobs=length
Python100
R语言中实现层次聚类模型

R语言中实现层次聚类模型

R语言中实现层次聚类模型大家好!在这篇文章中,我将向你展示如何在R中进行层次聚类。 什么是分层聚类?分层聚类是一种可供选择的方法,它可以自下而上地构建层次结构,并且不需要我们事先指定聚类的数量。该算法的工作原理如下:将每个数据点放入其自己的
Python60
R语言基本数据分析

R语言基本数据分析

R语言基本数据分析本文基于R语言进行基本数据统计分析,包括基本作图,线性拟合,逻辑回归,bootstrap采样和Anova方差分析的实现及应用。不多说,直接上代码,代码中有注释。1. 基本作图(盒图,qq图)#basic plotboxpl
Python180
时间序列分析——DTW算法详解

时间序列分析——DTW算法详解

DTW(dynamic time warping)是时间序列分析中一个很早(1994年,论文的年纪比我都大)也很经典的算法了。它其实借用的是经典算法的“动态规划”的思想。一般来说,时间序列数据如果要做分类,那么大体可以将实验步骤分为:数据预
Python270
基于R语言的分类、聚类研究

基于R语言的分类、聚类研究

1.所有在对iris数据集分(聚)类研究中,setosa均可以完全正确分(聚)类,而另外两类则会出现不同程度的误差,这也是导致整个研究模型出现误差的原因; 2.在使用的三种分类研究方法中,决策树模型的效果最优,因此可以使用该方法进行鸢尾
Python110
基于R语言的申请评分卡

基于R语言的申请评分卡

信贷行业中常见的评分卡包括:申请评分卡(Application)、行为评分卡(Behavior)、催收评分卡(Collection)以及反欺诈评分卡(Anti-Fraud),简称为A卡、B卡、C卡和F卡。 A卡,主要应用于贷前准入环节对
Python110
求FFT的c语言程序

求FFT的c语言程序

快速傅里叶变换 要用C++ 才行吧 你可以用MATLAB来实现更方便点啊此FFT 是用VC6.0编写,由FFT.CPP;STDAFX.H和STDAFX.CPP三个文件组成,编译成功。程序可以用文件输入和输出为文件。文件格式为TXT文件。
Python110
r语言var是什么意思

r语言var是什么意思

是指向量自回归模型。VAR是计量经济学中的一个概念,用于多元时间序列相关关系的分析。计算机语言中的var:Pascal:var在Pascal作为程序的保留字,用于定义变量。如:vara:integer,定义变量a,类型为整数varu:arr
Python60
R语言:十一个统计检验都在这了

R语言:十一个统计检验都在这了

R语言的各种检验 1、W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验) 检验数据是否符合正态分布,R函数:shapiro.test(). 结果含义:当p值小于某个显著性水平α(比如0.05)时,则认为
Python80
R语言|PLS-DA分析绘图示例

R语言|PLS-DA分析绘图示例

偏最小二乘法判别分析(PLS_DA)是一种用于判别分析的多变量统计分析方法,一种根据观察或测量到的若干变量值,来判断研究对象如何分类的常用统计分析方法。对不同处理样本(如观测样本、对照样本)的特性分别进行训练,产生训练集,并检验训练集的可信
Python100
R语言-05表的追加、连接、合并、求差集

R语言-05表的追加、连接、合并、求差集

merge函数,还有dplyr包中的inner_join()、full_join()、left_join()、right_join()、可以实现,分别对应内连接、外连接、左连接、右连接 目标:A是一个表,B是另一个表,求A-B,也就是A
Python150
《R语言实战》自学笔记69-重抽样和自助法

《R语言实战》自学笔记69-重抽样和自助法

数据准备 许多实际情况中统计假设(假定观测数据抽样自正态分布或者其他性质较好的理论分布)并不一定满足,比如数据抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,这时基于随机化和
Python80
R语言可视化通路富集网络图

R语言可视化通路富集网络图

我们输入的数据包含 gene ID 和 vector(单样本)部分,这里的 gene ID 是一个通用概念,可以是基因、转录本、酶或蛋白质。这里的 vector 可以是样本的表达量、倍数变化, p-value, 组蛋白修饰数据等可测量的属
Python140