SMOTE算法怎样增加新数据

Python070

SMOTE算法怎样增加新数据,第1张

方法:

‍要在数据透视表中增加新数据,解决的根本方法不是在透视表中做文章,而是要在源数据中增加数据,那么最好的办法就是将源数据设置为列表,因为列表可以支持数据的自动扩展。当数据扩展后,刷新数据透视表,就可以达到新增的目的了。以下是以2010版为例的操作。

1)准备数据过程中,遇到了缺失值的问题。以往都是自己手动写代码,用缺失值样本所在类别的均值或者众数替换掉,结果今天发现,DMwR2包就有处理缺失值的函数,而且思想一致【大哭】

  先奉上代码:

install.packages("DMwR2")

library(DMwR2)

knnImputation(YourDataFrame)

(2)准备用SMOTE函数时,发现DMwR包在老早之前,就从R语言 CRAN中移除了。多方搜索,找到了DMwR包的网页下载路劲:https://cran.r-project.org/src/contrib/Archive/DMwR/?C=DO=A。直接下载最新版,下载后将Zip文件存放至R语言目标文件夹的library中(主要是方便以后别人需要,我可以很快找到这个东西在哪里)。

比如,我的存放路径是:D:\Software\R-4.1.1\library

那么,现在回到R语言编程界面,输入代码:install.packages("D:/Software/R-4.1.1/library/DMwR_0.4.1.tar.gz", repos=NULL, type="source"),执行。【在这里我犯了一个小错,输入路径时候,把压缩包的后缀'.gz'落下了,由此走了好多弯路,解决不了,还下载R语言的2个老版本企图解决问题,不过还好问题没解决,我又发现了这个小错误。】