R语言中的tree和rpart有什么区别

Python025

R语言中的tree和rpart有什么区别,第1张

rpart包的处理方式:首先对所有自变量和所有分割点进行评估,最佳的选择是使分割后组内的数据更为“一致”(pure)。这里的“一致”是指组内数据的因变量取值变异较小。rpart包对这种“一致”性的默认度量是Gini值。确定停止划分的参数有很多(参见rpart.control),确定这些参数是非常重要而微妙的,因为划分越细,模型越复杂,越容易出现过度拟合的情况,而划分过粗,又会出现拟合不足。处理这个问题通常是使用“剪枝”(prune)方法。即先建立一个划分较细较为复杂的树模型,再根据交叉检验(Cross-Validation)的方法来估计不同“剪枝”条件下,各模型的误差,选择误差最小的树模型。party包的处理方式:它的背景理论是“条件推断决策树”(conditional inference trees):它根据统计检验来确定自变量和分割点的选择。即先假设所有自变量与因变量均独立。再对它们进行卡方独立检验,检验P值小于阀值的自变量加入模型,相关性最强的自变量作为第一次分割的自变量。自变量选择好后,用置换检验来选择分割点。用party包建立的决策树不需要剪枝,因为阀值就决定了模型的复杂程度。所以如何决定阀值参数是非常重要的(参见ctree_control)。较为流行的做法是取不同的参数值进行交叉检验,选择误差最小的模型参数。

tree的中文意思是树木。

tree

一、读音

英 [triː]  美 [triː]

过去式 treed 过去分词 treed 现在分词 treeing 复数 trees 第三人称单数 trees

二、含义

n. 树;木料;树状物

vt. 把...赶上树

vi. 爬上树;逃上树

n. (Tree)人名;(英)特里

扩展资料

同近义词

timber

1、读音:英 [ˈtɪmbə(r)]  美 [ˈtɪmbər]

2、含义:

n. 木材;木料

n. (Timber)人名;(瑞典)廷贝尔

3、语法:

复数 timbers

过去式 timbered

过去分词 timbered

现在分词 timbering

第三人称单数 timbers