lightgbm中如何进行k折交叉验证

2024-10-12 19:04:34

1、一般来说,CV的目的在于不进行超参数优化.目的是评估模型构建过程的性能.基本的训练/测试分裂在概念上与1倍CV相同(具有分割的自定义大小,与k倍CV中的1 / K训练大小相反).进行更多分裂(即k> 1 CV)的优点是获得有关泛化误差估计的更多信息.在获得错误统计不确定性的意义上有更多信息。

lightgbm中如何进行k折交叉验证

3、记驽怛判涮住这个想法,一般如何处理超参数估计(不仅仅是在LightGBM中)?>您希望在某些数据上使用一组参数训练模型,并在独立(验证)集上评估模型的每个变体.然后,您打算通过选择提供所选最佳评皙网胪阵估指标的变量来选择最佳参数.>这可以通过简单的列车/测试拆分来完成.但是评估的性能以及最佳模型参数的选择可能只是特定分裂的波动。

lightgbm中如何进行k折交叉验证

5、然后,您可以更进一步,并说您有一个额外的保留集,在超参数优化开始之前已分离.通过这种方式,您可以评估该集合上选择的最佳模型,以测量最终的泛化误差.但是,您可以更进一步,而不是只有一个测试样本,您可以有一个外部CV循环,这使我们进行嵌套交叉验证。

lightgbm中如何进行k折交叉验证
猜你喜欢