您无法为单个节点定义min\u samples\u leaf
,因为该模型最终可能会将更少的样本分配给整个模型的min\u samples\u leaf
,以确保符合适用于该单个节点的规则。
如果您正在处理不平衡的数据集,我建议您在输入模型之前对数据进行过采样或过采样,或者您可以手动设置类权重。
根据Scikit学习的用户指南:
在训练之前平衡数据集,以防止树偏向占主导地位的类。类平衡可以通过从每个类中采样相等数量的样本来完成,或者优选地通过将每个类的样本权重(sample_weight)之和标准化为相同的值来完成。