哪些误用的统计术语值得纠正?

机器算法验证 术语
2022-02-05 14:52:17

统计无处不在;然而,统计术语的常用用法往往不清楚。

术语概率几率在普通英语中可以互换使用,尽管它们定义明确且数学表达不同。

没有将可能性一词与概率分开,通常会使试图量化乳房 X 光检查结果为阳性的乳腺癌概率的医生感到困惑,“哦,胡说八道。我不能这样做。你应该测试我的女儿;她正在学医。”

同样传播的是使用相关性而不是关联性。或相关暗示因果关系

在 Al Gore 的著名纪录片An Inconvenient Truth中,一张幻灯片说明了冰芯与温度的相关性,而无需讨论更多的技术工作来证明因果关系:CO2

在此处输入图像描述

问题:哪些统计术语在没有数学严谨性的情况下使用时会造成解释问题,因此值得纠正?

4个回答

对抗语言的转变可能是徒劳的。

参数不代表变量

在经典统计中,在这种情况下,精确地从 RA Fisher 开始,他首先使用了具有此含义的术语,参数是要估计的未知常数,例如总体均值或相关性。在数学中,存在相关但不相同的含义,例如以参数方式给出曲线。在许多科学中,参数只是度量(本身是一个具有数学意义的密集术语)、属性或变量的另一个词,例如长度或电导率或孔隙率或美德,视情况而定。自然,一个人的身长或美德在被测量之前是未知的。但是有统计头脑的人可能会被它用于一组这样的测量而感到困惑。用普通或粗俗的说法,参数(几乎总是复数)通常表示某事的限制,例如个人关系或政治​​政策,可能源于最初与perimeter的混淆。以很高的先验概率假设贝叶斯主义者会用自己的用法为自己说话(感谢@conjugateprior)。

偏斜并不意味着有偏见

一个世纪或更长时间以来,偏度具有特定的统计意义,指的是分布的不对称性,无论是通过图形评估,数字测量,还是理论上假定为信仰或希望问题。在更长的时间里,或者可以猜测,偏见意味着平均是错误的,只要我们知道真相,即一个真实或正确的值——就可以量化为系统误差。偏斜在日常语言中具有被扭曲或扭曲的常识,因此也具有不正确、错误和偏颇的意思。这种感觉(据我所知,只是最近才注意到)已经开始过滤到统计讨论中,因此偏度的原始含义有被模糊或淹没的危险。

相关并不意味着一致

相关性在统计学中吸引了几种精确的含义,它们的共同点是在某种精确的意义上完美的二元关系:主要情况是线性和单调关系。即使在统计讨论中,它也经常被淡化为几乎任何类型的关系或关联。相关性不一定意味着一致:因此意味着只要的 Pearson 相关性为 ,但一致需要非常严格的条件 .y=a+bx11b0y=xa=0,b=1

独特并不意味着不同

将 data 的不同值称为unique是很常见的,但unique仍然可以更好地保留为仅出现一次的含义。我自己的猜测是,一些责任源于 Unix [原文如此] 实用程序uniq及其模仿者,它们将可能重复的值减少到一个集合,其中每个值都是唯一的。在这个猜测中,使用将程序的输入和输出混为一谈。(相反,如果我们谈论数据中的重复,我们很少将自己限制在恰好出现两次的双元上。术语复制在语言上会更有意义,但已被抢先在实验中故意复制对照;得到的响应值通常完全不同,这很重要。)

样本很少重复

在统计学中,一个样本包含多个值,重复抽样是一种很高的理论美德,但很少实践,除了模拟,这是我们对任何类型的silico伪造的习惯术语。在许多科学中,样本是一个单一的物体,由水、土壤、沉积物、岩石、血液、组织或其他物质组成的块、块或团,从有吸引力到良性到恶心不等;远非例外,采集许多样本对于任何严肃的分析都可能是必不可少的。在这里,每个领域的术语对其人民来说都非常有意义,但有时需要翻译。

错误通常并不意味着错误;正如 Harold Jeffreys 所指出的,主要的感觉是不稳定的,而不是错误的。

然而,我们应该警惕自己的罪过或术语怪癖:

期望值期望(对于可能结果的平均值)可能根本不是您所期望的,甚至可能是不可能的:在结果为 1 到 6 的情况下公平地掷骰子,期望值为 3.5

回归不会倒退

静止并不意味着不动或固定

自信与任何人的精神或心理状态无关

意义只是有时它的日常意义

精确通常是一个敬语,指的是方便处理的解决方案或计算,而不是适合问题的解决方案或计算

许多人的右偏分布看起来左偏,反之亦然(偏度的左右术语假设您正在查看类似于常规直方图的东西,具有水平幅度轴)

之所以称为对数正态,是因为它是指数正态

但对数正态比正态更正常

高斯分布是由 De Moivre 发现

泊松没有发现泊松,更不用说泊松回归了

引导程序不会帮助您穿鞋

折刀

峰度不是一种医疗状况

茎叶图不指植物

虚拟变量是有用的,不是毫无意义或愚蠢的

地球上(或其他任何地方)谁认为异方差性真的是比 不等可变性更可取的术语?

对于不同的群体,健壮现在至少有两个主要的技术含义,即使在技术讨论中,这两种含义都不会阻止其频繁使用,仅表示“断言表现良好”之类的意思

IV现在对于不同的群体至少有两个主要含义

factor现在对于不同的群体至少有两个主要含义

normalizestandardize有无数种含义(我们确实需要在那里进行标准化)

描述图表意味着垂直变量水平变量,除非它意味着相反

并且(最后但并非最不重要的,创造一个短语)统计数据至少具有三个主要含义。

笔记:

  1. 尽管有任何相反的表现,但我认为这是一个很好的、严肃的问题。

  2. 时尚转变。到了 20 世纪,似乎很多人(没有名字,没有练习,但可以提到 Karl Pearson)只能通过查阅他们的希腊语和拉丁语词典来发明术语。(不把散点图归功于他是不公平的。)但是 RA Fisher 确实劫持了许多预先存在的英语单词,包括方差充分性、效率可能性最近,JW Tukey 是使用家常话的大师,但很少有人会因为splomsbadmandments没有流行起来而感到苦恼。

  3. 一条评论基于对“生命是 [...] 乘法而不是加法:对数正态分布比正态分布更正态”的回忆。匿名。1962. Bloggins 的工作规则。在 Good, IJ (Ed.)中,这位科学家推测:部分成熟想法的选集。伦敦:Heinemann,212-213(引自第 213 页)。

我遇到的一些事情:

  1. 将显着性水平和 CI 覆盖概率视为可互换的,因此人们最终会做诸如“95% 显着性”之类的事情。

    [更糟糕的是,当犯此类错误的人指出他们的讲义——甚至是教科书——作为对此的支持时;换句话说,错误不是他们的,而是被复合了一百倍或数千倍,更糟糕的是,即使他们理解正确,他们实际上也可能不得不重复错误,才能通过主题。]

  2. 还有一种普遍的趋势是认为“重要性”以某种方式存在于特定假设/问题之外(导致诸如“我的数据是否重要”之类的问题,而对要解决的问题没有任何明确的概念)。[一个相关的问题是“我应该对这些数据使用什么测试?” 好像是数据——而不是要回答的问题——才是分析选择的驱动力。(虽然研究的“设计”会影响所使用的具体测试,但感兴趣的问题更为重要——例如,如果您有三个可用的组,但您感兴趣的问题仅涉及其中两个的比较,则事实上,你有三个并不强迫你做单向类型分析,而不是直接比较两组感兴趣的人...... 只要您选择的分析不是来自数据显示的内容。理想情况下,您在获得数据之前计划您的问题和分析,而不是对数据进行分析,然后看看有什么问题,这似乎是事后分析问题——包括“我应该对这些数据使用什么测试?” - 倾向于导致。)

  3. 偶尔倾向于将 p 值的补充称为某种“信心”或替代方案的“概率”。

  4. “非参数数据”;不幸的是,在几本书中发现了另一个(遗憾的是,在一篇声称纠正一个常见错误的文章中)这个出现频率很高,以至于它出现在我的自动生成评论的简短列表中(开头是“数据既不是参数也不是参数非参数的;那些是适用于模型或技术的形容词......”)(感谢尼克考克斯提醒我这个特别的问题)

    通常预期的是“非正态数据”,但参数并不意味着正态,并且具有近似正态并不意味着我们需要参数过程。同样,非正态性并不意味着我们需要非参数程序。有时,所指的是“序数数据”或“名义数据”,但在这两种情况下,这并不意味着有限参数模型是不合适的。

  5. 误解“线性模型”中“线性”含义的常见趋势,这与“广义线性模型”中“线性”一词的使用不一致。这部分是我们使用术语的方式的错误。

  6. 将平均负中位数的偏度与三阶矩偏度混为一谈,并将任一(或什至两者)中的零与对称性混为一谈。这两种错误都经常出现在某些特定应用领域广泛使用的基本文本中。[将零偏度和零超峰度视为暗示正态性存在相关错误]

  7. 这个非常常见,以至于很难再将其称为错误(部分原因是特定程序的努力)——将过度峰态简单地称为“峰态”;一个错误几乎肯定会导致沟通问题。

数据”是复数(单数是“基准”)。

虽然严格来说不是一个统计术语,但我投票反对内生性它被用来指代从反向因果关系到混淆到选择和对撞机偏差的所有事情,当所有人真正想做的是说:“没有确定这种影响”。