第10章－基于树的方法(2)-树的剪枝

发布时间：2021-03-14 19:18:25 所属栏目：大数据来源：网络整理

导读：10.8 通过剪枝得到最优规模的树之前我们讨论的都是如何生成树，接下来我们要讲解的是如何进行剪枝。我们令一个树 T 的误分类误差的期望为 R ? ( T ) . 回想一下，我们是用再代入误差估计，估计的 R ? ( T ) ，即 R ( T ) = ∑ t ∈ T ′ R ( t ) = ∑ t ∈

结果如下：

第10章－基于树的方法(2)-树的剪枝

cptable 提供了对于所有适合的模型的一个概要。数据从最小的树(没有分裂)，一直到最大的树。
cp : 表示复杂度参数；
nsplit：表示分裂节点的数量；
xerror：表示交叉验证得到的错误率；
xstd：表示交叉验证得到的错误率的标准差；

通常，我们选取最小xerror值对应的树。
通过下面的代码可以自动的获取最优子树：

opt <- model.tree$cptable[which.min(model.tree$cptable[,"xerror"]),"CP"]

（编辑：衡阳站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

6/7

首页

尾页

建筑行业和技术变革的	怎样用好数据科学
总做描述性统计深入的	高考结束用 Python 来