R语言使用moments包计算偏度(Skewness)和峰度(Kurtosis)实战计算偏度(Skewness)和峰度(Kurtosis)、确定样本数据是否具有与正态分布匹配的偏度和峰度(假设检验)。
聚类的包,cluster包,里面包含了pam,agnes等函数,可以十分方便进行聚类计算。另外有系统自带的stats包,hclust, kmeans等函数。fpc包做聚类分析,也是可以的。另外,如果需要例子,这些包自带的文档里面都有使用的实例,是很好的学习案例。刚接触R语言一周,和matab不同R作用于数据挖掘的库很多,详解见 R语言数据挖掘包
,下面简介文本分析经常使用到的三个包
tm 为文本挖掘提供综合性处理 Rwordmsg 进行中文分词 wordcloud 统计词云
以第三届泰迪杯A题提供的数据集国美-Sheet1进行文本分析 : 第三届泰迪杯
转化为txt的数据集如下图所示:
生成词云: