R语言使用moments包计算偏度(Skewness)和峰度(Kurtosis)实战计算偏度(Skewness)和峰度(Kurtosis)、确定样本数据是否具有与正态分布匹配的偏度和峰度(假设检验)。
刚接触R语言一周,和matab不同R作用于数据挖掘的库很多,详解见 R语言数据挖掘包
,下面简介文本分析经常使用到的三个包
tm 为文本挖掘提供综合性处理 Rwordmsg 进行中文分词 wordcloud 统计词云
以第三届泰迪杯A题提供的数据集国美-Sheet1进行文本分析 : 第三届泰迪杯
转化为txt的数据集如下图所示:
生成词云:
1、通过选择菜单:
程序包->安装程序包->在弹出的对话框中,选择你要安装的包,然后确定。
2、使用命令
install.packages(package_name,dir)
package_name:是指定要安装的包名,请注意大小写。
dir:包安装的路径。默认情况下是安装在..\library 文件夹中的。可以通过本参数来进行修改,来选择安装的文件夹。
3、本地来安装
如果你已经下载的相应的包的压缩文件,则可以在本地来进行安装。请注意在windows、unix、macOS操作系统下安装文件的后缀名是不一样的:
1)linux环境编译运行:tar.gz文件
2)windows 环境编译运行 :.zip文件
3)MacOSg环境编译运行:.tgz文件
注:包安装好后,并不可以直接使用,如果在使用包中相关的函数,必须每次使用前包加载到内存中。通过library(package_name)来完成。 包安装后,如果要使用包的功能。必须先把包加载到内存中(默认情况下,R启动后默认加载基本包),加载包命令:
Library(“包名”)
Require(“包名”) 1、查看包帮忙
library(help=package_name)
主要内容包括:例如:包名、作者、版本、更新时间、功能描述、开源协议、存储位置、主要的函数
help(package = package_name)
主要内容包括:包的内置所有函数,是更为详细的帮助文档
2、查看当前环境哪些包加载
find.package() 或者 .path.package()
3、移除包出内存
detach()
4、把其它包的数据加载到内存中
data(dsname, package=package_name)
5、查看这个包里的包有数据
data( package=package_name)
6、列出所有安装的包
library()