R语言分组箱线图添加显著性标记简单小例子

Python015

R语言分组箱线图添加显著性标记简单小例子,第1张

最终出图如下

这里自动做统计检验的函数是 stat_compare_means()

读入数据

作图

这个函数来自于ggpubr这个包,只需要指定根据那一列来分组就可以了

默认的是Wilcoxon Rank Sum and Signed Rank Tests,如果要用t检验指定method参数

如果想把P值改成星号,直接加label=“p.signif”参数

这里如果不显著会在图上显示ns,如果不想要ns,可以加 hide.ns = TRUE 参数

星号的位置可以手动指定,用 label.y = c(26,31) 参数

使用到的是 ggsignif 这个包

小明的数据分析笔记本

2018.08.02

R语言中有smbining可以进行最优分箱,python中分箱如果既要考虑箱体个数,分箱后信息量大小,也要考虑单调性等其他因素。

这里给出一种简单的通过IV值来选择如果分箱的方法。

下面是按照分位数来分的,还可以按照卡房分箱,决策树分箱等。

参照toad(由厚本金融开发的较标准的评分卡开发开源包)的分箱方式。