我阅读了以下有关统计独立性的文章。总而言之,这篇文章认为“是时候让科学摆脱统计独立性的虚构了”,并继续解释了不同的原因。读完这篇文章,我倾向于同意。我想知道以下内容:
- 其他经过交叉验证的用户怎么看?
- 有没有学术资源可以让我指出来确认或拒绝文章提出的概念?更具体地说,现实生活中的数据集是否(或不)表现出统计独立性?
谢谢!
我阅读了以下有关统计独立性的文章。总而言之,这篇文章认为“是时候让科学摆脱统计独立性的虚构了”,并继续解释了不同的原因。读完这篇文章,我倾向于同意。我想知道以下内容:
谢谢!
在我看来,作者假设大多数科学家不知道或不了解如何处理相关性,并且几乎假设不存在使用处理相关数据的方法(可能在 Makov Chains 之外)。事实并非如此。有许多统计方法可以解释相关数据,大多数统计学家、流行病学家、生态学家和其他科学家知道(或应该)何时使用适当的方法。我不认为科学家需要放弃假设独立的方法,因为它们非常有用——如果它们不是模拟和现实世界的实验,证明它们的有用性就不会比比皆是。相反,如果有的话,
那只是我的两分钱。
我完全不赞同作者的观点。特别是根据我的经验,绝对不是“[..] 压倒性的普遍做法只是假设采样事件是独立的”。相反,相关性问题是我们必须经常处理的问题(在我从事金融行业的工作期间)。而且,最重要的是,我们清楚地意识到这一点!
不过,我完全同意简化现实世界的说法。对我来说,归因于 George Box 的名言是这里的主要指南:
所有模型都是错误的;有些模型很有用。
当然,迄今为止广为宣扬的统计独立性的概念几乎是一个神话(大部分)。我不认为任何人应该不同意宇宙及其内部的一切,与其他一切一起工作。
事实上,就统计独立性而言,它仅存在于数据集或某种类型中,它以非常具体的术语存在。但总的来说,依赖是宇宙不可分割的一部分。