研究方法、统计素养和沟通

机器算法验证 数据可视化 解释 方法
2022-04-16 14:14:05

在与客户交谈或提供建议时,我经常发现自己不得不质疑随着时间的推移绘制变量的选择。例如,如果客户有兴趣了解响应变量 Y 和变量 X 之间的关系,他们要做的第一件事就是绘制它们随时间的变化图:在此处输入图像描述

我认为,这个想法是直观地评估一个变量随时间的变化是否与另一个变量的变化相关联。

作为一名统计顾问,由于显而易见的原因,我发现这种方法并不令人满意,并建议改为使用散点图。

困难在于解释对于所面临的问题类型,时间很少是因果关系,会分散读者的注意力并且是多余的(同样,我们对随时间的变化不感兴趣)。

我正在寻找有关如何最好地向非统计学家解释有更有效的方法来理解两个变量之间的关系的建议。之前有没有顾问处理过这个问题,他们做了什么来解决这个问题?

2个回答

顾问的位置很尴尬,因为顾问的利益不符合客户的要求,所以任何“让我们不要”的回击都会引起不愉快的感觉。

让他们跌倒,然后把他们捡起来:根据我的经验,我建议先按照他们的要求实现他们的愿望。然后介绍替代方法并向他们解释所提出方法的优缺点。是的,一开始就浪费了一些时间,但通常可以减少很多可怕的拔河比赛。

到目前为止,这种方法还没有引起任何问题。大多数时候我赢了,但偶尔有些固执的人坚持他们会保留旧的,但至少我觉得我给了客户一个机会,让他们做出明智的选择。如果事情变得太荒谬,我会要求将我的名字从与该项目相关的所有作品中删除。

慢慢建立他们的统计“品味”:例如,在您的情况下,我建议使用散点图将它们分解,然后也许会激发他们欣赏互相关函数图,这可能比散点图。

在文献中展示证据:与分析类型、术语和数据表示相关的争论也可以通过展示一些支持您的建议的当前出版物来解决。

我不是顾问,但我将尝试将您的观点传达给非统计学家:

1)举一个例子,其中关系实际上是因果关系。

2)跟进几个反例,其中关系是虚假的。这里有一些你可能会提到的幽默例子: http ://www.tylervigen.com

(1) 的目的是与非专家沟通,您已经考虑过他们的担忧,并且您也没有完全不屑一顾。(2)的目的显然是要怀疑他们对因果关系的假设,但也希望以一种简单的方式说明这一点,而不是居高临下。之后,您可以提供您认为更好的方法。