是一次输入所有预测变量还是执行分层回归?

机器算法验证 多重回归
2022-04-16 18:40:32

首先,请原谅我的天真,但我才刚刚开始研究。

研究概况

我正在做一个研究青春期社交焦虑并使用社交网络分析 (SNA) 的项目。我认为消极的同伴关系解释了社交焦虑的差异,超出了个人层面的特征(在这种情况下是人格变量)。

我有以下变量:

  • 因变量:社交焦虑评分

  • 自变量:

    • 人口统计:种族,来自父亲收入的 SES,来自母亲收入的 SES
    • 人格变量(Big 5):神经质、开放性、责任心、外向性、随和性
    • 网络变量:单方面拒绝(不喜欢网络的程度),相互反感(相互厌恶关系的总和);关系失调(收到的不喜欢的领带与发送的类似领带的总和)。

我的参与者总数是 94。

根据过去的研究,正如预期的那样,神经和外向性可以预测社交焦虑。过去的研究表明,单方面的拒绝应该与社交焦虑有关。在我的研究中,没有一个网络变量与社交焦虑有预期的关联,它们都不是社交焦虑的重要预测因子。事实上,只有神经质和外向性才接近显着。所有其他双变量相关性都极低。

我认为不显着的结果主要是由于方法问题。

由于回归假设独立观察但 SNA 假设相互依赖,因此分析可能无法了解关联。同样,样本量小也没有足够的功效。

好的。简而言之,这就是我的故事。我不想找到显着的结果,我只想知道进行回归的最佳方法,所以我至少知道我这样做是正确的。

我想以块的形式输入它们,因为这会改变 R 平方,但我不想做出任何错误的假设并做一些不合适的事情。

问题

  • 我应该使用分层方法吗?我最初的想法是在区块 1 中包含人口统计数据;块 2 中的人格变量和块 3 中的网络变量。
  • 还是我应该同时输入预测变量并报告结果,因为它们无论如何都不重要?
2个回答

是使用分层回归还是一次输入所有预测变量

  • 作为起点,分层回归的最后一个块与您一次输入所有预测变量相同。
  • 如果您有一个与分层回归一致的假设,那么您应该执行分层回归。您的假设是用一组变量来解释另一组变量的差异。因此,您有一个与层次回归一致的假设。

具有非显着双变量相关性的问题

  • 如果每个预测变量和因变量之间的所有相关性都不显着,那么尽管如此处所讨论的情况不一定如此,但您的整体回归模型和分层回归中的 r 平方变化很可能都是不显着的-重要的。因此,正如您所收集的,快速查看相关性可以让您了解层次回归问题的答案可能是什么。
  • 尽管如此,多元回归在用于探索性和验证性目的的程度上可能有所不同。因此,如果您正在确认,那么预测变量与因变量不显着相关的事实不应阻止您执行分层回归。

经验法则是每个 IV 10 例。你有(如果我没记错的话)11 次静脉注射。还不算太远。两个 SES 变量肯定是高度相关的吗?它们可以结合起来,这样你就可以减少到 10 个 IV。

关于依赖与独立 - 你还没有说你的抽样计划是什么。如果 SNA 方面仅在变量中而不在样本中,您可以进行 SNA 并仍然获得独立的观察结果。但是,如果所有学生都来自一个或几个班级,那么您可能确实有相关数据。

关于你的问题:你可以做任何一个。每个都将与另一个一样违反假设。这不取决于重要性甚至影响大小。由于您想报告 R 平方的变化,我会选择您的第一个选项。但是,这可能会导致其他人(编辑、教授、任何人)看起来不屑一顾。