机器算法验证 - iid 意味着什么？ - 吾爱随笔录

机器算法验证时间序列可能性分布独立独立同居

2022-04-04 10:24:31

经常看到数据必须是独立同分布的陈述，但是如果时间序列中的数据是独立的，它们不只是噪音吗？有一次我认为，它们只是指错误，即错误必须是独立的。为什么确定性部分应该是串行独立的？我可以看到信息计算的必要性。但是，总而言之，这令人困惑。

谁能告诉我 iid 的确切含义？作家不会把自己弄得很清楚。谢谢你。

1个回答

我们经常假设我们感兴趣的随机变量是独立且同分布的（iid）。您可能还对更广泛的术语可交换性感兴趣（另请参见此处）。

这意味着它们是独立的，所以松散地说，知道一个值不会告诉我们关于其他值的任何新信息，更正式地说，如果事件和是独立的，那么 $A$ $B$

Pr (A \cap B) = Pr (A) Pr (B)

$\Pr(A \cap B) = \Pr(A) \, \Pr(B)$

因此，单独观察每个事件的概率为我们提供了有关联合观察这些事件的概率的完整信息。它们不会相互影响或相互作用。

通过说它们是同分布的，我们的意思是它们可以用相同的概率分布来表征。因此，就概率行为而言，它们是“同类”。

但如果时间序列中的数据是独立的，它们不只是噪音吗？

对，他们是。对于时间序列，我们对值之间的时间依赖性感兴趣，因此我们不假设独立性。

为什么确定性部分应该是串行独立的？

如果它是确定性的，那么它就不可能是独立的。

其它你可能感兴趣的问题