86-预测分析－R语言实现-树模型rpart

2023-02-24 21:33:02Python019

86-预测分析－R语言实现-树模型rpart,第1张

数据集的行是游戏玩家们玩的每一次游戏，列是某个玩家玩游戏时的速度、能力和决策，都是数值型变量。

任务是根据这些表现的衡量指标来预测某个玩家当前被分配到8个联赛中的哪一个，输出变量（LeagueIndex）是一个有序的类别变量，序号从1到8，最后一个对应的是技术最高的玩家组成的联赛。

一种对待序号输出的可能方式是把它们当作一个数值型变量，作为回归任务来建模，并构建一个回归树。GameID列表示唯一的游戏标识符，跟模型无关，可以丢弃；另外TotalHours列被识别为字符型，需要修正为数值型。

Age、HoursPerWeek和TotalHours存在缺失值，直接删除带有缺失值的行。（虽然树模型可以自动处理缺失值，但是后面还会使用其他模型来对比，那些模型不一定能处理缺失值）

使用rpart包构建回归树模型。

对于输入特征，我们会关注它用在树里任何地方时产生的优化准则（例如偏差或SSE）里的约简，将树里所有分裂的这个量值汇总起来，就得到变量重要性的相对数量。

越重要的变量会越早用来分裂数据（离根节点更近），也会更常用到。如果一个变量从来没有用过，那么就是不重要的，通过这种方式，可以用来做特征选择，但是这种方法对特征中的相关性敏感。

不能发链接，所以我复制过来了。

#载入程序和数据

library(RSNNS)

data(iris)

#将数据顺序打乱

iris <- iris[sample(1:nrow(iris),length(1:nrow(iris))),1:ncol(iris)]

#定义网络输入

irisValues <- iris[,1:4]

#定义网络输出，并将数据进行格式转换

irisTargets <- decodeClassLabels(iris[,5])

#从中划分出训练样本和检验样本

iris <- splitForTrainingAndTest(irisValues, irisTargets, ratio=0.15)

#数据标准化

iris <- normTrainingAndTestSet(iris)

#利用mlp命令执行前馈反向传播神经网络算法

model <- mlp(iris$inputsTrain, iris$targetsTrain, size=5, learnFunc="Quickprop", learnFuncParams=c(0.1, 2.0, 0.0001, 0.1),maxit=100, inputsTest=iris$inputsTest, targetsTest=iris$targetsTest)

#利用上面建立的模型进行预测

predictions <- predict(model,iris$inputsTest)

#生成混淆矩阵，观察预测精度

confusionMatrix(iris$targetsTest,predictions)

#结果如下：

#predictions

#targets 1 2 3

# 1 8 0 0

# 2 0 4 0

# 3 0 1 10

变量模型数据缺失数值

# 上一篇：C语言谁的书好？

# 下一篇：Python的if 条件语句

给您推荐相同类型的内容：

php和go语言哪个好
前言最近工作中遇到的一个场景，php项目中需要使用一个第三方的功能，而恰好有一个用Golang写好的类库。那么问题就来了，要如何实现不同语言之间的通信呢？下面就来一起看看吧。常规的方案1、用Golang写一个httpTCP服务，php通
R语言岭回归的自变量可以为名义变量吗，如果有怎么处理
ridge regression可以用来处理下面两类问题：一是数据点少于变量个数；二是变量间存在共线性。当变量间存在共线性的时候，最小二乘回归得到的系数不稳定，方差很大。这是因为系数矩阵X与它的转置矩阵相乘得到的矩阵不能求得其逆矩阵，而r
golang的struct能解决什么问题
structGo语言中，也有struct，定义与C语言类似，举例说明如下：type person struct {name stringage int}上面就声明了一个结构体person，包含两个字段。可以如下来使用这个struct：var
Python包管理工具pip的安装和使用
Python有两个著名的包管理工具easy_install.py和pip。在Python2.7的安装包中，easy_install.py是默认安装的，而pip需要我们手动安装。方法1：利用常用curl获取 &gt&
go是什么意思
go的意思如下：1、放得进，适合；相配，协调；除尽，除；进行，进展；被接受，被允许；开始做（某事），进入（某种状态）；变为，变得（尤指朝坏的方面）；处于（尤指令人不快的状况）；有助于；可得到；流逝；不复存在；变坏；用于。2、（游戏或活动
R语言中条件概率怎么表示
用[]，[]内是条件B，[]外是变量Ap(A|B)=p(A&ampB)p(B)https:districtdatalabs.silvrback.comconditional-probability-with-r描述马氏链的(
R语言系列之1------数据类型
最近身体状况不太好的我，已经懒惰到不太想用脑子思考问题了，但也总不能什么事情都不做就这样蹉跎岁月吧，于是想着把自己之前的知识总结总结。今天就先把R语言的知识总结总结吧。 R语言是一个应用非常广泛的并且免费的用于统计计算和作图的计算机语言
java如何处理高并发？
你指的高并发量大概有多少？x0dx0a几点需要注意：x0dx0a尽量使用缓存，包括用户缓存，信息缓存等，多花点内存来做缓存，可以大量减少与数据库的交互，提高性能。x0dx0a用jprofiler等工具找出性能瓶颈，减少额外的开销
在R语言中,只已知2个样本各自的个数,均值,方差,怎么检验差异是否显著？
如果两个样本具有方差齐性，那么做独立样本t检验时，直接套用t检验的公式，计算t值，，查表的自由度为n1+n2-2，然后用函数pt( t value, n1+n2-2)给出p值，小于0.05即为显著。如果方差不齐，需要计算校正后的自由度，
基于Java语言的打地鼠的小游戏源代码是什么？
　public void mouseClicked(MouseEvent e){x0dx0aObject source=e.getSource() 获取事件源，即地鼠标签x0dx0aif(source instanceof
C语言合法语句的条件
C语言合法语句的条件：算法只要满足了有穷性、确定性、输入、输出、可行性五个特点，算法的优劣来自于时间和空间复杂度，复杂度越低的算法效率就高。标识符由字母（A-Z，a-z）、数字（0-9）、下划线“_”组成，并且首字符不能是数字，但可以是字
go语言培训班哪个好
很多人盲目的寻找所谓的go语言开发培训排行榜，但是因为没有一个统一的标准，这样一个靠谱的排行榜其实不存在，请注意我这里说的是靠谱的。排行榜有，但都是一些个人总结的，有太多的个人主观的喜好在里面，没有权威的第三方机构进行评测。那么排行榜不靠谱
Python的if 条件语句
Python 中用if语句进行条件判断；与Excel 中的if作用有些类似，具体的语句如下： if条件：结果 else：结果下面我们来举例进行说明：例1：年龄&gt=18岁，输出“成年了
python读取财经数据
提取日期数据基本语法 from WindPy import w w.start() 当出现.ErrorCode==-103说明没连接上，要start一下w.wsd(security, fields, startDate
python 代理ip爬取，ip代理，数据库存储，去重，验证。
首先是ip_request.py 这个模块是对ip的一个验证，随机生成header头。 ip_to_mysql.py 本文是对ip进行存储，和提取ip，删除ip的操作。这个是对日志的一个封装，这样用起来方便些。总结，
网站开发一般需要什么技术谁能逐步列举一下由初期到结尾
需要一个非常细致谨慎专业的过程要有自己发展的初期想法想做什么要有熟练的技术去实现自己的想法怎么去做要有做这些东西完善的策划怎么做比较好需要整个环节中最重要的后期规划售后和服务计划以及整个环节的各种成本资源储备充足着手进行网
c语言语句有哪些?
C语句可分为以下五类： 1.表达式语句； 2.函数调用语句； 3.控制语句； 4.复合语句； 5.空语句。 1.表达式语句表达式语句由表达式加上分号“；”组成。其一般形式为：表达式；执行表达式语句就是计算表达式的值。例如： x=y+z
求《Java编程思想第四版完整中文高清版高清无水印》全文免费下载百度网盘资源,谢谢~
《Java编程思想第四版完整中文高清版高清无水印》百度网盘pdf最新全集下载:链接: https:pan.baidu.coms18YR38kxwOl-Qqd5wNsXWmw?pwd=mj3f 提取码: mj3f简介：本书赢得了全球
河北金融学院的办学条件
截至2015年4月，河北金融学院有教职工700余人，其中博士生导师、硕士生导师36人，高级专业技术职务教师占专任教师比例为33.7%，硕士以上学位教师占教职工总数的比例达90.3%。有河北省管优秀专家、河北省有突出贡献的中青年专家、河北省
R语言数据转置
#读取wet.txt需要转换的目标矩阵，显示原行列。本例中行为sample，列为otu otu&lt-read.delim('E:\R语言网络分析\wet.txt',sep='t',
Go语言文件操作
本文主要介绍了Go语言中文件读写的相关操作。文件是什么？计算机中的文件是存储在外部介质（通常是磁盘）上的数据集合，文件分为文本文件和二进制文件。os.Open() 函数能够打开一个文件，返回一个 *File 和一个 er
如何用r语言进行数据分类
首先，原始数据是由name(名字)，class(班级)，course(课程)和score(分数)组成的，将其导入R语言并存储在Mydata对象里接下来，我们利用sqldf包来处理分组汇总的问题。由于sqldf包不是R语言自带的，所以先用以下
Python笔记：Python装饰器
装饰器是通过装饰器函数修改原函数的一些功能而不需要修改原函数，在很多场景可以用到它，比如① 执行某个测试用例之前，判断是否需要登录或者执行某些特定操作；② 统计某个函数的执行时间；③ 判断输入合法性等。合理使用装饰器可以极大地提高程序的
r语言横坐标设置不同颜色
R语言中的颜色1 颜色名称表示法R语言中的颜色表示方式主要有两种，一种是用颜色的名称表示，例如：blue、red、orange等等，要知道R语言中颜色名称可以使用colors()方法得到。下图只显示50个颜色值：library(scales
用java计算长方形的面积
父类Sharp 如下：public abstract class Sharp {定义面积方法 public abstract double area()}子类RectSharp 继承父类：public class Re
java基础面试题有哪些？
下面是10道java基础面试题，后附答案1.什么是 Java 虚拟机?为什么 Java 被称作是“平台无关的编程语言”?Java 虚拟机是一个可以执行 Java 字节码的虚拟机进程。Java 源文件被编译成能被 Java 虚拟机执行的字
java中垃圾回收机制的原理是什么？
GC的工作原理:引用计数,标记复制"引用计数"是一种简单但速度很慢的垃圾回收技术.所有对象都有一个引用计数器,当有引用连接时计数器加1,当引用离开作用域时或者被置于NULL时,计数器-1,垃圾回收器会在所有包含对象引用的
Java中继承和接口的区别
1，一个类只能继承一个类，但是可以实现多个接口。2，依赖倒转原则：依赖抽象（例如接口），不要依赖于实现。3，合成聚合复用原则（CARP）：尽量使用合成聚合，而不是继承关系达到复用的目的。4，接口传达的意思是：拥有某种功能，能干嘛，比
python 代理ip爬取，ip代理，数据库存储，去重，验证。
首先是ip_request.py 这个模块是对ip的一个验证，随机生成header头。 ip_to_mysql.py 本文是对ip进行存储，和提取ip，删除ip的操作。这个是对日志的一个封装，这样用起来方便些。总结，
r语言画图默认字号
用于指定文本大小的参数cex：表示相对于默认大小缩放倍数的数值。默认大小为1，1.5表示放大为默认值的1.5倍。0.5表示做小为默认大小的0.5倍。cex.axis：坐标轴刻度文字的缩放倍数。类似cex。cex.lab：坐标轴标签（名称）的

推荐阅读

热门文章

最新发布

标签列表

86-预测分析－R语言实现-树模型rpart

给您推荐相同类型的内容：