party包的处理方式:它的背景理论是“条件推断决策树”(conditional inference trees):它根据统计检验来确定自变量和分割点的选择。即先假设所有自变量与因变量均独立。再对它们进行卡方独立检验,检验P值小于阀值的自变量加入模型,相关性最强的自变量作为第一次分割的自变量。自变量选择好后,用置换检验来选择分割点。用party包建立的决策树不需要剪枝,因为阀值就决定了模型的复杂程度。所以如何决定阀值参数是非常重要的(参见ctree_control)。较为流行的做法是取不同的参数值进行交叉检验,选择误差最小的模型参数。
我只用过arules和Rweka,后来就不用R做数据挖掘了,直接用weka。其他R包可以上cran上搜索。
题外话:ctree是决策数,算是分类算法,和关联规则不是一个概念吧。当然很久没碰,可能记错了。
rpart包,rpart包是官方推荐的一个包,它的功能就是实现递归分割和回归树。
party包,关于递归分割更为详细的包,它包含了Bagging方法,可以产生条件推断树(conditional inference tree)等;
randomForest包,实现了分类与回归树的随机森林(random forest)算法。