给定一组多年来{A, B, C, D, E}
每月发生一次的事件:n
[A, B, C, C, B, D, A, B, C, C, B, D]
[E, B, C, B, B, D, E, B, C, B, B, D]
[C, B, C, D, E, A, A, D, C, C, B, D] //12 months x 3 years pictured
...
我有一个概率函数p(w, r) = ...
,它计算一个事件跟随另一个事件的概率(例如 B 之后的 A),其中w
和r
是对输出进行建模的参数,当正确选择时应该适合样本数据。
我的最终目标是预测一年内的事件,但我坚持使用 EM 来确定w
和r
。
直觉上,我现在做的是:
- 从和的总随机值
w
开始r
- 使用函数计算每一对在一年中的概率(例如
A
和B
)p
,将其与从样本中提取的实际概率分布进行比较,并基本上得到v
当前w
和r
拟合样本的概率( )。 - 现在我的第三步是修改
w
,r
所以它v
应该收敛到 1。这就是我卡住的地方。
我应该如何使用v
来获得新的值w
,r
以便v
最终收敛到 1?
编辑:
我想补充一点,这p
基本上给了我事件连续性的估计概率分布。这意味着我有两个 2D 表面:估计和采样概率分布,我想使用w
并r
移动和缩放估计的表面,使其最适合采样的表面。
所以我的问题是,如何在一步之后比较两者,以及下一步如何获得新值w
和r
值。
例如:我在想我可以使用某种矩阵范数来获得两者之间的相似程度,然后根据之前的迭代来决定是否应该增加w
/r
减少。