在 Bishop 的模式识别和机器学习中,我在概率密度之后阅读了以下内容介绍了:
在变量的非线性变化下,由于雅可比因子,概率密度的变换不同于简单函数。例如,如果我们考虑变量的变化,然后是一个函数变成 . 现在考虑概率密度对应于密度 关于新变量, 其中 suffic 表示这样一个事实和是不同的密度。范围内的观测值将,对于小的值 , 转化为范围) 其中 ,因此.
什么是雅可比因子,一切究竟意味着什么(也许是定性的)?Bishop 说,这个属性的一个结果是概率密度最大值的概念取决于变量的选择。这是什么意思?
对我来说,这有点出乎意料(考虑到它在介绍章节中)。我会很感激一些提示,谢谢!