提问者:小点点

调整特定树节点的树参数


我使用来自sklearn

我需要更正特定树节点中使用的拆分器(功能),min\u samples\u leaf

我怎么做?


共1个答案

匿名用户

您无法为单个节点定义min\u samples\u leaf,因为该模型最终可能会将更少的样本分配给整个模型的min\u samples\u leaf,以确保符合适用于该单个节点的规则。

如果您正在处理不平衡的数据集,我建议您在输入模型之前对数据进行过采样或过采样,或者您可以手动设置类权重。

根据Scikit学习的用户指南:

在训练之前平衡数据集,以防止树偏向占主导地位的类。类平衡可以通过从每个类中采样相等数量的样本来完成,或者优选地通过将每个类的样本权重(sample_weight)之和标准化为相同的值来完成。