以下术语之间有什么区别还是相同?
- 偏见
- 系统偏差
- 系统性错误
如果存在一些差异,请解释它们。当增加样本量时可以减少这些错误吗?
更新: 我感兴趣的领域是统计推断。我的意思是说,作为统计学家,我们如何区分这些术语。
以下术语之间有什么区别还是相同?
如果存在一些差异,请解释它们。当增加样本量时可以减少这些错误吗?
更新: 我感兴趣的领域是统计推断。我的意思是说,作为统计学家,我们如何区分这些术语。
“偏差”一词在统计基础文献中以两种方式出现:
“……偏见 ,有时称为系统误差,...” [EL Lehmann, Theory of Point Estimation, 1983. 这是经典文本。] 在 Lehmann 的符号中,这是标准的,是由参数给出分布时的期望值,是一个估计器,是一个观察,并且是要估计的分布的属性(估计值)。换句话说,观察(或其序列)是一个随机变量,它使估计随机,而偏差是估计与估计之间的预期偏差。它取决于(未知但真实的)分布,使其成为真实分布的函数。Lehmann 用一整章的篇幅介绍了无偏估计量:无论.
在测量理论中,“偏差”(或“系统误差”)是测量期望值与真实基础值之间的差异。例如,校准误差或仪器漂移可能会导致偏差。将此用法与以前的用法进行对比:在这里,偏差是测量的属性,它是一个物理过程,而在此之前,它是统计估计器的属性(这是从数据中进行猜测的数学定义程序)。
“系统偏差”似乎仅在将偏差与随机“错误”区分开来时使用:术语“错误”往往主要用于具有零期望的随机项。
在许多情况下,随着数据量的增加,第一种意义上的偏差会减少:实际上,随着数据量的增加,许多有偏差的估计器的偏差会越来越小(尽管这在理论上并不能保证,因为偏差的概念是如此广泛)。一个很好的例子是分布方差的最大似然估计,当独立抽奖从该分布中可用。ML 估计量是
为了. 众所周知,这是有偏见的;估计者是公正的。从何而来,如,变得渐近无偏。
然而,测量环境中的偏差(第二种意义)通常无法通过进行更多测量来减少:偏差是测量过程本身固有的。人们必须通过校准测量程序或将其与已知没有(或更少)偏差的其他程序进行比较来估计和减少偏差,估计偏差并对其进行补偿。
用于统计推断的术语的简要描述并不能取代已经发布的扩展和更专业的回复。相反,它旨在作为对它们的介绍,并作为一个温和的警告,要警惕在有限的上下文中做出的普遍概括,例如“所有三个[术语]都等同于'系统错误'”,这显然是正确的只是狭义上的,因为我引用的两个定义是不等价的。阅读其他回复提醒我,流行病学等专业领域的文献可能以意想不到的方式使用熟悉的标准统计术语,如“偏差”,其中一些实际上可能与统计定义相矛盾。到底,
如果我通过流行病学研究学到了什么,那就是这是一个没有真正对错的雷区。我喜欢统计学,因为它至少有数学基础,而流行病学更多的是意见。那就是说我会尽力回答你的问题。
来自 M. Porta流行病学词典第 5 版。没有提到系统偏差,系统误差说“见偏差”。这留下的偏见被描述为:“结果或推论与事实的系统偏差。……导致结果或结论系统地(相对于随机地)与事实不同。” 我会说不存在非系统性偏差,因为它们都会使您的结果偏离真实的风险估计。关于偏差最重要的一点是你不能通过增加样本量来减少它。
偏见有很多种,我听说其中一篇关于偏见的原始文章包含 300 多种不同的类型。重要的是在您开始学习之前识别它们,然后尝试设置您的学习/实验以避免偏见。在流行病学研究中,将偏见分为三类非常有用:
选择偏差是指您为研究选择了错误类型的个体。假设您有兴趣了解在煤矿工作是否存在风险——如果您在煤矿寻找您的研究对象,您可能会发现他们比一般人群更健康,因为那些生病的人不再在煤矿工作,即您选择最健康的个体,您不再研究源人口而是研究子样本。选择偏差通常是最恶性的偏差类型,因为它很难识别。
信息偏差是指您有关结果或暴露的数据收集有误。一个常见的错误是外科医生问他的病人手术后是否好转。在这里,患者可能不想让外科医生失望并报告他/她本来会更好的结果,外科医生可能不想承认手术失败,报告和采访者偏见。
信息偏差也称为观察偏差。当它是连续变量中的错误时,它是测量错误,而在分类设置中则存在错误分类偏差。错误分类意味着研究个体最终可能被归入错误的类别,吸烟者可能因偶然或报告偏见而被错误分类为非吸烟者。即使错误分类是偶然的(非差异错误分类),它仍然倾向于以系统的方式低估风险,尤其是当您的类别很少时。尽管Jurek 等人的一项出色的研究。2005 年表明,您应该谨慎地根据一项研究做出这个假设。关于您的问题,我可能会认为这是与系统偏差相关的“非系统偏差”。
混杂因素是与暴露和结果相关的因素,并且与研究个体更密切相关。例如Lambe 等人。2006 年的研究表明,怀孕期间吸烟会增加学习成绩低下的风险,但是当观察母亲在第二次怀孕期间停止吸烟的亚群中的兄弟姐妹时,他们的学习成绩同样糟糕。这表明吸烟不是导致学习成绩差的原因,但可能是其他社会因素的混杂因素。
Sica 等人的这篇文章。2006 年更详细。您必须做好准备的是,该领域确实缺乏对术语的共识。我的梦想是,WHO 有朝一日能够制作一份易于理解、直观且辩论最终可能结束的定义列表。
术语可能因领域而异。但是,使用以下评论中定义的术语:
以下术语之间有什么区别还是相同?
不,这三个都等同于“系统性错误”。
当增加样本量时可以减少这些错误吗?
不,增加样本量会减少随机误差,而不是系统误差。
评论
这些术语取自流行病学领域,特别是来自 Rothman 及其同事在《现代流行病学》第 9 章和第 10 章中对错误的讨论。
总结一下:
调查员的目标是对人群中的某些度量(例如平均值、相对风险、风险比等)提供准确的估计。准确的估计是既有效又精确的估计。一个有效的估计值将有一个接近总体真实值的点估计值(例如,平均值、相对风险、风险比等)。精确的估计将在点估计周围具有狭窄的置信水平。此外,相对于研究人群,估计值可以是内部有效的,相对于一般人群而言,估计值可以是外部有效的。
与准确性的偏差是由错误引起的。有两种主要类型的错误:系统错误和随机错误。
系统误差,通常称为偏差,会导致估计无效。系统误差包括由于混杂、选择偏差和信息偏差引起的误差。通常可以使用分层或回归等技术来纠正混杂。选择和信息偏差传统上要么被忽略,要么仅在分析中进行定性评估,这可能是由于不熟悉适当的偏差分析。但是,确实存在用于定量偏差分析的方法(例如Lash TL 和 AK Fink (2003))。
随机误差导致估计不精确。随机误差包括抽样误差和随机测量误差等。提高精度的方法包括增加研究规模、提高研究效率以及优化统计分析(如合并和回归)的精度。
更新
为了说明为什么增加样本量不会减少与飞镖类比的系统误差(复制自此CV 帖子):
无论向棋盘扔了多少飞镖,当存在“高偏差”时,点数估计都不会转向真正的靶心。这里的“bias”相当于“systematic error”,“variance”相当于“random error”。
这些 power point摘录有一些信息来补充 jthetzel 和 Max Gordon 给出的内容。它们以调查数据为导向,并不严谨或正式,但如果你想要那种类型的答案,你可能会在有关测量理论或调查方法的教科书中寻找。