r语言 neuralnet 包使用的是什么算法

Python010

r语言 neuralnet 包使用的是什么算法,第1张

Hmisc,主要用里面的recode函数来转换数据,比如把c("Jan", "Feb", "Mar")转换成1, 2, 3

reshape/reshape2,主要用来整理数据,做pivot table,方便进行下一步的统计或绘图

ggplot2,绘图

scales,用来生成特定的数据格式,比如百分数

R.matlab,以matlab支持的格式导出数据

dplyr,支持对data.frame的灵活操作,很方便!

​  初识recode命令,我以为它就是个改缺失值的小能手。我们常常看见它是这样出现的:

​  它的作用等效如下:

​  再识recode,才发现这个小命令没那么简单!掌握了recode,处理起数值型变量不是一般地溜!好东西就要分享,接下来,我就给大家全面解析recode命令。

​  recode命令的完整语法如下:

​  其中, varlist 是指我们想改变的一到多个变量; erule 是我们指定的改变规则,形式为 新值=旧值 。可以同时指定多个规则,每个规则用小括号括起来,用空格分隔; if 和 in 是条件和范围筛选语句,可以根据目的自由添加;最后是一些重要的 options 选项,后面会具体介绍。

​  注意:在recode命令中的1/5和Stata数列表示中的1/5不同。数列表示中1/5指1,2,3,4,5这5个整数,但在recode命令中1/5包括1到5闭区间内全部实数。 ​

  此外,我们还可以用min和max来代表数值,且在等号左边和右边均可。

​  为了更好说明含关键词的规则形式,我们先用input命令输入一些变量与数值:

​  并且为了更好展示效果,插播一下,介绍两个简单但十分重要的选项:

  首先是 generate() 选项,用于生成新变量的变量名。其次是 prefix() 选项,用于添加新变量前缀。如果不使用这两个选项,我们使用recode命令时就会使初始数据产生改变,带来很多不方便,因此 强烈推荐 在使用recode命令时添加这两个选项之一。 ​

  例如:将原始数据中的1到5改为0,并将改变后的数值储存在一个由原变量名称添加前缀"new_"的新变量中。

​  此时,数据集如图所示:

​  recode命令中的规则指定是有序的。从左到右的规则中,一旦一个值在前面已经被指定做出某种改变了,在后面的规则中如果再次指定这个值,会被忽视。以刚刚的数据为例:

​  在recode命令中,如果添加if或in语句限定了观测值改变范围,在产生的新变量中,范围外的数值将会变为缺失值。例如,指定前三行的数值进行相应改变:

​  观察数据集可发现,前三行外的数值全部变成了缺失值。这时加上copyrset选项,就会将范围外的观测值原样复制到新变量中。

​​  label()选项可以说是recode命令的灵魂,正是因为有label()选项,recode才可无愧于分类神器这个称号。在之前的推文 让你的数据一目了然--label命令介绍 中,我们介绍过如何使用label命令来给值贴标签。一般分为两步走,先用label define 定义值标签,再用label value 贴标签。而recode命令中,简单一行命令就可以搞定这两步! ​

​  下面我们以Stata提供的网络数据集来介绍一下recode命令中的label()选项:

​  查看repair这个值标签的内容。

​  直接在每个规则指定后面用双引号添加新标签内容,并且在最后添加label()选项为新标签命名即可:

​​  今天对recode命令的介绍就到这里了,快去动手试试分类你的数值型变量吧!