我一直在使用各自的下标看到有关期望的符号,例如. 该等式取自https://ai.stanford.edu/~ang/papers/icml04-apprentice.pdf和,以贝叶斯 IRL 论文为例。(https://www.aaai.org/Papers/IJCAI/2007/IJCAI07-416.pdf)
我明白那个表示起始状态从起始状态的分布中得出. 但是我们如何理解带有下标的后者? 怎么从转移概率的分布中得出?
我一直在使用各自的下标看到有关期望的符号,例如. 该等式取自https://ai.stanford.edu/~ang/papers/icml04-apprentice.pdf和,以贝叶斯 IRL 论文为例。(https://www.aaai.org/Papers/IJCAI/2007/IJCAI07-416.pdf)
我明白那个表示起始状态从起始状态的分布中得出. 但是我们如何理解带有下标的后者? 怎么从转移概率的分布中得出?
点 () 在......的最后显示我们可以从状态中去的所有可能状态通过行动. 如您所知,这里有一些选择这些状态的概率,这些概率的总和等于 1。因此,是一个概率分布。