具有特定统计意义的常用词

机器算法验证 术语
2022-02-03 06:28:41

我不是统计学家,但我的研究工作涉及统计学(分析数据、阅读文献等)。对我在此处发布的一个问题的评论再次提醒我,对于那些在统计领域有良好实践的人来说,有些常用词具有特别特定的含义或内涵。

列出这样的单词会很有帮助,并且可能是短语和一些评论。

4个回答

我发现了一篇 2010 年的参考论文,该论文着眼于这个问题。

安德森-库克 CM。隐藏的行话:具有统计特定含义的日常用语。ICOTS8,国际教学统计会议,斯洛文尼亚卢布尔雅那,2010 年 7 月 11-17 日。

该论文可在线免费获得,因此我仅提供作者讨论的部分术语列表:

 confounding, control, factor, independent, random, uniform

显着”——在这里,该词的通用语言用法是表示“重要”或“有意义”之类的东西。统计意义非正式地更接近于“可以从零点的随机变化中辨别出来”;这并不意味着差异足够大。

以下是一些示例,其中这种区别可能会导致一些混淆:1 2

参数”——似乎经常发生——尤其是在科学实验中——“参数”一词的使用方式与统计学家使用“变量”一词的方式相同。维基百科是这样说的:

统计参数是索引一系列概率分布的参数。它可以被视为群体或模型的数值特征

这可能是一个问题的示例:1 - 大概是导致这个问题的帖子。(我最近看到另一个,但我现在找不到它)

“错误” - 在统计中,它通常意味着观察值和预测值之间的任何偏差。在现实生活中,这意味着错误。

我遇到了在“伪造假设”中使用“伪造”的问题,而其他人则认为我指的是“编造数据”。此外,“有偏见”几乎不可能在不引起混淆的情况下提及。