Python统计分析:[4]多因素方差分析
上一篇文章介绍了Python做统计中如何实现单因素方差分析,这篇文章介绍一下如何做多因素方差分析以及当主效应显著时如何做多重比较。
引入相关模块![Python统计分析:[4]多因素方差分析](https://exp-picture.cdn.bcebos.com/3852f6e5eceeadbce85c02c4cd18dfdae53b7bcb.jpg)
读取数据(如果你需要我案例中的数据,可以联系我索要)![Python统计分析:[4]多因素方差分析](https://exp-picture.cdn.bcebos.com/4e168d5653bbf8200588d3bfba21056105a36ecb.jpg)
删除空值并打印数据
我们可以看到数据是酱紫的:![Python统计分析:[4]多因素方差分析](https://exp-picture.cdn.bcebos.com/031231632385e03697e2025cb8e039723c035acb.jpg)
用statsmodels中的anova_lm,注意公式formula的写法
这是随即设计的两因素方差分析的结果:结果显示fetus的主效应显著![Python统计分析:[4]多因素方差分析](https://exp-picture.cdn.bcebos.com/5e4e9c2b74ee1c32cd6b149807f1d8a727334bcb.jpg)
阴虚fetus的主效应显著,所以有必要进行事后简单,使用tukey方法进行多重比较的方法及结果:
输出的结果显示,三个水平均均值均呈现显著差异(reject==Ture)![Python统计分析:[4]多因素方差分析](https://exp-picture.cdn.bcebos.com/49c5d3e34b2c56eef40cc3baf775e5f4fdf540cb.jpg)