我有一个作业问题,要求我创建一个具有多数票的 3 级树(根、中间和叶),如果 3 级树是不可能的,则扩展树。我必须使用 ID3 算法。它是一个手动问题,而不是编码分配,数据集包含 16、4 个特征和一个以 T、F 为值的类标签。我开始计算不同节点的熵和信息增益。当我完成 3 级树时,我可以以 50%、100%、100% 和 75% 的多数票或置信度分配叶子上的类。我的问题是
- 50%真的是多数票吗?
- 我是否需要扩展树中具有 50% 置信度的部分
- 或者我可以任意分配课程?
问候
我有一个作业问题,要求我创建一个具有多数票的 3 级树(根、中间和叶),如果 3 级树是不可能的,则扩展树。我必须使用 ID3 算法。它是一个手动问题,而不是编码分配,数据集包含 16、4 个特征和一个以 T、F 为值的类标签。我开始计算不同节点的熵和信息增益。当我完成 3 级树时,我可以以 50%、100%、100% 和 75% 的多数票或置信度分配叶子上的类。我的问题是
问候
ID3 的目标是尽可能获得最纯的节点(具有讽刺意味的是,这是导致其过度拟合问题的原因),因此 50% 根本不是纯节点,该节点下的数据同样可能属于使peedicition 很棘手,最好将树进一步生长并找到比至少 50% 更纯的节点。