回归分析的一个假设是和没有交织在一起。但是,当我想到它时,在我看来这是有道理的。
这是一个例子。如果我们有一个包含 3 个部分(AB 和 C)的测试。总测试分数等于 3 个部分的单项分数之和。现在可以说可以是 A 部分的得分,而可以是整体测试得分。那么线性回归可以回答这个问题:A 部分的总体测试分数的可变性是多少?在这里,有几种情况是可能的:
- A 部分是 3 个部分中最难的部分,学生的分数总是最低的。在这种情况下,直觉会很低。因为大部分整体考试成绩将由 B 和 C 决定。
- A部分对学生来说很容易。在这种情况下,相关性也不会很高。因为学生在这部分的得分总是 100%,因此这部分没有告诉我们关于整体考试成绩的任何信息。
- A部分为中级难度。在这种情况下,相关性会更强(但这也取决于其他分数(B 和 C)。
另一个例子是:我们分析尿液中微量元素的总含量。我们独立分析尿液中微量元素的单个种类(化学形式)。可以有许多化学形式。如果我们的分析是正确的,那么化学形式的总和应该与元素的总含量相同(通过不同的技术分析)。然而,询问一种化学形式是否与尿液中的总元素含量相关是有意义的,因为该总含量是该元素从食物中总摄入量的指标。那么,如果我们说是尿液中的总元素,而是尿液中的化学形式 A,然后通过研究相关性,我们可以探索这种化学形式是否是导致整体可变性的主要形式。
在我看来,有时即使和不是独立的,这也是有道理的,并且在某些情况下这可以帮助回答科学问题。
您认为在上述示例中是否有用或有意义?如果我们考虑上面的考试成绩示例,我已经说过,如果学生的难度完全相同,每个部分的贡献率约为 33%。但在实践中,这不一定是正确的。所以我在想也许使用回归分析可以帮助我们了解考试每个部分的真实可变性。所以在我看来,即使我们已经知道原假设不正确
是否有替代的修正回归方法来解释这种情况并为我们提供有意义的参数?