决策树训练完后应该认真检查一下

文摘   2024-11-05 09:23   辽宁  

如果可视化决策树的决策规则(在每个节点评估的条件),会发现它们总是与特征轴垂直,如图所示。

换句话说,每棵决策树逐步根据这些垂直边界对特征空间进行划分,以分割数据。

当然,这本身并不是一个‘问题’。

实际上,这种垂直划分使得决策树能够完美地过拟合任何数据集。然而,这也引出了一个在拟合决策树时常常被忽视的有趣问题。

如果数据集有一个对角线决策边界,会发生什么?

如下所示:

在这种情况下,可以很容易地猜测,决策树学到的决策边界预期如下所示:

通过可视化这棵决策树,会发现,为了拟合这个很容易划分的数据集,它产生了很多分割,而像逻辑回归、支持向量机(SVM)甚至是一个小型神经网络都能轻松处理。

人工智能大讲堂
专注人工智能数学原理和应用
 最新文章