鉴于统计测试的进步,估计相关性本身就可以结束吗?

机器算法验证 相关性 计算统计
2022-03-26 04:13:31

背景背景:

我对人们在这个网站上提出的复杂统计问题感到惊讶,我从他们身上学到了很多东西。谢谢你们!

但是,我专注于相关性,因为对于像我这样没有受过正规统计培训但需要进行市场研究作为我工作的一部分的人来说,这是一种容易理解的方法。我的很多项目都试图测试两个变量之间的关系,所以我使用的是 Pearson 的 r。

我知道每种统计方法都有特定的目的,并且需要满足某些基本假设才能正常运行。

问题:

  • 相关性(特别是 Pearson 的 r)本身可以成为目的吗?
  • 鉴于统计测试的所有进步,它仍然是一种稳健的数据分析方法吗?
4个回答

对我来说,你的问题的答案是否定的。

我不认为给定的方法或技术本身就是目的。如果您手头有一些数据,或者甚至在开始收集数据之前,您应该问自己要解决哪些问题,或者您想回答哪些问题。当你有了数据和问题后,你就可以开始思考技术了。

如果你专注于一种特定的技术,你可能会对自己隐藏很多东西。在这种情况下,您将回答或想要回答的问题在很大程度上取决于您打算使用的技术。想了很多关于以下谚语:

如果你只有一把锤子,一切看起来都像钉子

此外,我想指出以下几点。确实有很多花哨的技术。然而,仅仅使用一种奇特而复杂的技术这一事实本身并不能验证统计分析。或者换一种说法,花哨的技术不能代替令人信服的经验策略。

正如@lejohn 所说,这是真的,如果你只有一把锤子,那么一切看起来都像钉子。

不过,如果你只有一根钉子,那你可能只需要一把锤子,这也是事实!

要做的事情是定义你的实质性问题,无论是来自市场研究、心理学、物理学还是其他什么。然后调查方法,可能不是你自己。解决问题的方法可能是相关性。它可能是其他非常简单的东西。但它可能不会。

永远不要忽视绘制数据。在此示例中,X 和 Y 之间的相关性为 0,但肯定这两个变量是相关的。

| xx
 | xx
 | xx   
 | xx
是| xx
 | xx
 | xx
 | xxx
 |_______________________________
               X

我同意在此线程中发布的其他人的观点,但有一点要补充:当您可以更加确定没有更复杂的事情发生时,简单的方法(例如相关性)更合理。

在实验工作中,您使用随机化来考虑可能复杂的观察到和未观察到的变量,您从简单的相关性中获得的里程比从观察数据中获得的结果要多得多,因为观察数据之间存在各种复杂的相互作用你测量的变量和你没有测量的变量。我不确定你有什么样的市场研究数据。如果是观察性的,我会更担心只依赖相关性。

也就是说,相关性等简单方法起着非常重要的作用。在我的大部分工作中,我尝试从简单的关系开始,例如相关性、t 检验和卡方检验,这些关系以人们更容易直观理解的方式建立关系。只有在我建立了实质性的理解之后,我才会展示更复杂的模型。在这一点上,它是关于解决威胁和创建更好的估计,而不是关于提出强有力的实质性观点。