我正在尝试通过将其置于其通常使用的符号(即)的上下文中来遵循有关贝叶斯模型平均的本教程:machine-learning
X_train : 训练数组;暗淡 =;
y_train目标向量;暗淡 =你适合训练数组(正确的值);
x : 样本属性的输入向量;暗淡 =; 和
y:输出预测值;预测值的标量[为简单起见])。
这些都在下面贝叶斯的背景下描述......
.
来源将其描述为由索引的模型类别:
: 一组模型中的模型索引
.
贝叶斯模型选择:
:输入数据:成形输入数组(行 = 样本,列 = 属性);
:输出预测n :预测的长度输出向量基于;
:训练数据: 包含 (i) 的元组数组(行 = 样本,列 = 属性);(ii)包含训练数组描述的实际值/类别的长度向量
(请让我知道这是否令人困惑,我会详细说明)
该视频说,这是每个模型预测的概率的平均值。你平均的权重是后验分布给定.
我的困惑:
有人可以描述一下这是如何平均模型的吗?你最终会得到一个由所有模型创建的后验吗?在这种情况下,先验在哪里?
整合所有模型如何平均它们?据我所知,积分可以为您提供曲线下的面积,但在统计数据中,我经常听到“求和/积分”参数/变量这个术语。这到底是什么意思?
请提供一个简单的示例,以便我了解它是如何工作的 :) 这对于试图了解贝叶斯模型平均如何准确工作的人来说肯定是有用的。我会在那个视频上放一个链接,因为我知道其他人也很困惑。