我正在使用 HMMLearn python 包来隐藏马尔可夫模型。该实现建立在多元高斯分布之上。
所以我有一系列的功能。高斯对截然不同的特征尺度有多敏感?如果一个特征在 0 和 1 之间缩放,而另一个在 0 和 1e8 之间缩放,它真的会倾斜吗?
我正在使用 HMMLearn python 包来隐藏马尔可夫模型。该实现建立在多元高斯分布之上。
所以我有一系列的功能。高斯对截然不同的特征尺度有多敏感?如果一个特征在 0 和 1 之间缩放,而另一个在 0 和 1e8 之间缩放,它真的会倾斜吗?
不缩放数据有很多陷阱,通常建议对其进行缩放。它很容易做到,它是可逆的,并且在其他操作中很有用,比如去除异常值。
在使用多元高斯进一步分析隐马尔可夫模型的细节后,理论准确性不应因特征尺度的巨大差异而受到影响。但是,涉及多元高斯分布的一个重要操作是矩阵求逆。
尽管理论上的可逆性不会改变,但由于尺度的不同,您的问题的实际数值解可能会不准确。迭代方法将存在收敛问题,直接求解方法将受到刚度的影响。当存在线性相关等常见并发症时尤其如此。
这是一组关于 HMM 的 3 场讲座,其中包含关于多元高斯的一些细节 ( 1 - 2 - 3 )
我知道我们已经在评论中讨论过这个问题,但我想结束这个问题,所以将其添加为答案。
我希望这有帮助!