加入收藏 | 设为首页 | 会员中心 | 我要投稿 衡阳站长网 (https://www.0734zz.cn/)- 数据集成、设备管理、备份、数据加密、智能搜索!
当前位置: 首页 > 大数据 > 正文

第10章-基于树的方法(2)-树的剪枝

发布时间:2021-03-14 19:18:25 所属栏目:大数据 来源:网络整理
导读:10.8 通过剪枝得到最优规模的树 之前我们讨论的都是如何生成树,接下来我们要讲解的是如何进行剪枝。 我们令一个树 T 的误分类误差的期望为 R ? ( T ) . 回想一下,我们是用再代入误差估计,估计的 R ? ( T ) ,即 R ( T ) = ∑ t ∈ T ′ R ( t ) = ∑ t ∈

结果如下:

第10章-基于树的方法(2)-树的剪枝

cptable 提供了对于所有适合的模型的一个概要。数据从最小的树(没有分裂),一直到最大的树。
cp : 表示复杂度参数;
nsplit:表示分裂节点的数量;
xerror:表示交叉验证得到的错误率;
xstd:表示交叉验证得到的错误率的标准差;

通常,我们选取最小xerror值对应的树。
通过下面的代码可以自动的获取最优子树:

opt <- model.tree$cptable[which.min(model.tree$cptable[,"xerror"]),"CP"]

(编辑:衡阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读