“独立同分布”是假设还是事实?

机器算法验证 独立 假设 独立同居
2022-04-01 21:17:24

这是在两个随机变量的背景下。一个常见的假设(例如方差分析中的误差项)是独立且同分布的随机变量。这个网站上有一个问题,询问如何在给定的数据集中检查假设。这是假设还是事实?

4个回答

只是为了增加讨论,这主要是一个简化推理数学的假设。

举一个具体的例子,我在图像处理领域,通常大多数算法会假设图像中的噪声是 IID。几乎从来没有这种情况,因为大多数时候我们对成像进行一些预处理(例如:平滑或平均),这将引入邻域成像像素之间的相关性。此外,属于相似结构的像素将具有相似的属性,测量设备的点扩散函数等都会使 IID 假设严格不成立。

在任何现实世界的情况下,它通常是一个假设,但这取决于您要达到的目标,才能判断该假设是否有效。

在实践中,独立同分布是一个假设;它有时可能是一个很好的近似值,但几乎不可能证明它确实成立。

一般来说,你能做的最好的事情就是证明它不会失败太严重。

这就是诊断,在某种程度上假设检验试图做的事情。例如,如果有人查看残差的 ACF(对于按顺序观察到的数据)以查看是否存在任何明显的序列相关性(这意味着独立性不成立)......但是具有小样本相关性并不意味着独立性.

[如果你试图评估一些统计程序的假设——或者特别是如果你试图在可能的程序之间进行选择——通常最好避免为此目的进行假设检验。假设检验不能回答您真正需要回答的问题,并且以这种方式使用数据进行选择将影响您选择的任何后续程序的属性。如果您必须测试类似的东西,请避免测试您正在运行主测试的数据。]

De Finetti 会说,条件独立性是您假设可以在实验中观察到其值的随机变量序列是可交换的逻辑结果。

这取决于问题,但 iid 通常是基于两个随机变量近似独立且同分布的假设(或者至少我们有充分的理由相信它们是)。在我们假设 iid 的大多数情况下,我们不能声称完全独立或两个随机变量的分布完全相同,但无论如何我们都会做出假设,然后根据数据检查假设。

但是,在某些情况下,iid 可以被视为“事实”。例如,考虑一个实验,您将单个骰子放入杯子中,摇动杯子,然后滚动骰子。如果你这样做两次,我认为没有人会难以接受这两个骰子都是独立同分布的事实。