机器算法验证 - 具有特定统计意义的常用词 - 吾爱随笔录

机器算法验证术语

2022-02-03 06:28:41

我不是统计学家，但我的研究工作涉及统计学（分析数据、阅读文献等）。对我在此处发布的一个问题的评论再次提醒我，对于那些在统计领域有良好实践的人来说，有些常用词具有特别特定的含义或内涵。

列出这样的单词会很有帮助，并且可能是短语和一些评论。

4个回答

我发现了一篇 2010 年的参考论文，该论文着眼于这个问题。

安德森-库克 CM。隐藏的行话：具有统计特定含义的日常用语。ICOTS8，国际教学统计会议，斯洛文尼亚卢布尔雅那，2010 年 7 月 11-17 日。

该论文可在线免费获得，因此我仅提供作者讨论的部分术语列表：

 confounding, control, factor, independent, random, uniform

“显着”——在这里，该词的通用语言用法是表示“重要”或“有意义”之类的东西。统计意义非正式地更接近于“可以从零点的随机变化中辨别出来”；这并不意味着差异足够大。

以下是一些示例，其中这种区别可能会导致一些混淆：1 2

“参数”——似乎经常发生——尤其是在科学实验中——“参数”一词的使用方式与统计学家使用“变量”一词的方式相同。维基百科是这样说的：

统计参数是索引一系列概率分布的参数。它可以被视为群体或模型的数值特征

这可能是一个问题的示例：1 - 大概是导致这个问题的帖子。（我最近看到另一个，但我现在找不到它）

“错误” - 在统计中，它通常意味着观察值和预测值之间的任何偏差。在现实生活中，这意味着错误。

我遇到了在“伪造假设”中使用“伪造”的问题，而其他人则认为我指的是“编造数据”。此外，“有偏见”几乎不可能在不引起混淆的情况下提及。

其它你可能感兴趣的问题