怎么把连续变量转换成分类变量

Python013

怎么把连续变量转换成分类变量,第1张

需要手动编码设置,没有自动生成的

用编码功能,不同编码生成不同的变量

比如如果分类=1的时候

生成新变量列,对应=1的值为1,该列其他单元格为0

分类-2的时候

对应生成一个新的变量列

对应=2的值为1,该列其他单元格为0

如此

1、连续变量样式

自变量“孕前子宫内膜厚度”本身是一个连续变量,我们用上面这一连续线来表示。如某医生总共收集了100个case。

2、找截点

将所有数据按照大小排列,将排列好的100个case平均分为10组(若想进行更加细致的分析,可以分为更多组),每组10个case。计算每组的妊娠发生率

3、合并结局发生率相似的组

将妊娠发生率相似(差别较小)的相邻组合并成一组。根据实际情况决定合并后的组数,一般建议3-4组。由此,将连续变量转换为分类变量,将结局发生率相似的组认为是一类。

4、按照分类变量的要求,设置成哑变量纳入模型

于是,这样我们就将原本是连续变量的数据转换为分类变量。数据需要进行转换的原因是该连续变量的数据与结局之间并非线性关系,而可能是折线或抛物线等非线性关系。那么,应该直接将连续变量纳入模型进行分析,还是先转换为分类变量?这需要依据数据的实际情况,并结合临床目的进行数据处理和结果解读,以得到对客观世界真实合理的诠释。

一般线性回归和logsitic回归都是可以的。这关键得看你的因变量,如果因变量是连续型变量,你就用一般线性回归建模,分类的自变量也是可以通过哑变量处理的;如果因变量是分类变量那就用logistic回归建模。