编辑:虽然我很欣赏 Peter Flom 的建议和随后的讨论(并赞成他的回答),但我正在开奖以征求答案,该答案提供了一种特定的、正式的统计方法来处理这些不一致,同时最大限度地减少数据丢失。我强烈怀疑这个问题已经激发了我在下面的要点(或者可能完全不同!)的统计研究,但我不知道它并希望引起某人的注意。我会认为一个仅是参考和简短描述的答案值得赏金; 无需为我派生或实施该方法。我也接受一个给出聪明方法的答案,有一些细节,没有参考。我认为@Momo 可能会在下面的评论中有所作为,所以也许这个赏金会引出更多细节/背景信息 :)
编辑:为了建立一个易于处理的模型,我愿意假设不一致是“随机”出现的,例如由于随机错误阅读问题或错误点击平板电脑/计算机上的答案,因此错误可能与@whuber 在评论中给出的示例相反,可以认为它独立于任何辅助变量。
我最近遇到了一个关于对问题的答案不一致的统计问题。我认为这是一个基本问题,就像当您有多个评分者对如何评价特定项目有不同意见时,我认为这种语言可能更熟悉,这就是我选择这个标题的原因。
一个玩具例子:
Q1:你抽烟吗?
A1:没有
Q2:你一天抽多少支烟?
A2:5
当然,问卷中的“跳过模式”可以防止这种情况发生,但那艘船已经航行了。实际情况比这更复杂,涉及的问题更多,矛盾也更细微,但基本问题是一样的。问我这个问题的人的疑问可以简单地表述为:
是否有方法可以消除某种程度的不一致性,同时仍保留尽可能多的样本?
我非常清楚,如果您想“安全”,那么唯一要做的就是丢弃任何回复不一致的样本,但这不是我正在寻找的答案。特别是,在某些情况下,有充分的证据表明特定的回答是错误的,我正在寻找使用该证据的原则方法——作为一个极端的例子,假设十个问题测量相同的整体结构,十个问题中有九个同意 - 那么不同意的很可能是一个错误(例如错误阅读问题或错误点击用于管理调查的计算机/平板电脑)
我对这个主题的基本想法让我想起了两个一般想法:
尝试建立一个模型来估计特定项目是错误的概率并切换“错误概率”非常高的响应。我担心的是,a)如果不对“错误率”做出疯狂的假设,这是无法处理的;b)如果每个构造只有几个(比如 3 或 4 个)问题,这种方法基本上是无用的。
尝试选择问题的一些“可靠子集”(即尝试确定分歧是否经常来自问题的特定子集)。这样我就可以摆脱从数据集中删除列而不是行。这似乎是合理的,但更像是一个临时程序,我不确定如何正式化。
我对这个领域一点也不熟悉,而且在统计咨询中似乎偶尔会出现这种问题,所以我想知道在尝试“重新发明”之前如何处理(除了丢弃数据)轮”。