我查看了 Tianqi Chen 的演示文稿,但我很难理解叶子重量的细节,如果有人能帮助澄清我的理解,我将不胜感激。
要将方程式转化为幻灯片“放入上下文:模型和参数”中的文字,预测值/分数(表示为 yhat)等于模型的 K 树的总和,每个树将属性映射到分数。到目前为止一切顺利,我想。
然后在下面显示的这张幻灯片中,它给出了一个决策树的模拟示例,该示例计算了某人喜欢电脑游戏 X 的数量。(旁白:这不是一个奇怪的例子吗?谁喜欢电脑游戏 X 的数量为 2?什么?这甚至意味着什么?为什么不选择一个具有更具体、相关意义的例子呢?)
现在这是我开始迷路的地方。我可以将模拟示例的模拟数据制成表格,假设模型是完美的,因此权重(w1、w2、w3)等于真实值。但即使这样看起来也很奇怪:预测值/分数和权重之间有什么区别?
x_i: "attributes" y_i, the true score (not yhat_i, which is the predicted score)
| |
|¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯|¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯|
| Age <15 (x_0) | is male (x_1) | Amount likes the computer game X |
| 1 | 1 | 2 | (Young boy)
| 1 | 0 | 0.1 | (Young girl)
| 0 | 1 | -1 | (Old man)
| 0 | 0 | -1 | (Old woman)
| 0 | 0 | -1 | (Young woman, older than 15)
我的问题是:有人可以分享实际功能 f 吗?我假设它是一个向量/矩阵,但实际数字是多少?那么我的后续跟进是你将如何计算这个模拟示例的 f?我觉得这是一个如此简单的问题,但我无法弄清楚答案。如果有人可以为我详细介绍这一点,那将是一个巨大的帮助。谢谢!

