r语言lasso回归变量怎么筛选

Python013

r语言lasso回归变量怎么筛选,第1张

你可以用EXCEL中的“自动筛选”功能。选中数据第一行,按工具栏中的“数据-筛选-自动筛选”,就会在数据第一行出现下拉框,点中它,从下拉框中选“自定义”,会出现一个对话框,在这个对话框的左边框中选“包含”,右边框中填上“公园”(不要引号),确定后就把所有含有“公园”的数据筛选出来了,其他的会自动隐藏。同理,在“包含”的右边框中填上“门店”,就会把所有含有“门店”的数据筛选出来。

与上一篇《单因素方差分析》组合,就是筛选与因变量相关,自变量不相关(最大相关,最小冗余)的原则进行降维

针对连续变量:利用相关性

选出2至26列,显著相关的自变量,cor存储了高度相关的变量对,以及对应的相关系数

cor.test()计算相关系数

针对分类变量:利用卡方检验

对2至126列,利用chisq.test()进行卡方检验