看起来您可以对一个分类变量使用编码,但我有两个分类变量和一个连续预测变量。我可以在 SPSS 中为此使用多元回归吗?如果可以,如何使用?谢谢!
当我混合了分类和连续预测变量时,我可以使用多元回归吗?
机器算法验证
回归
spss
分类数据
连续数据
2022-03-22 05:56:27
3个回答
- 如果这是一个 SPSS 语法问题,答案就是将经过适当编码的分类变量与连续变量一起放入“自变量”的变量列表中。
- 关于统计:你的分类变量是二进制的吗?如果是这样,您需要使用虚拟或其他有效的对比代码。如果它不是二元的,那么您的分类变量是序数还是名义变量?如果是名义上的,那么再次,您必须使用一些对比代码策略 - 实际上模拟变量的每个级别对结果或“因”变量的影响。如果分类变量是有序的,那么很可能明智的做法是将其按原样输入模型,就像使用连续预测变量(即“独立”)变量一样。在这种情况下,您会假设分类预测变量(“独立”)变量的级别之间的增量;这很少会是一个错误,但如果是这样,您应该再次使用对比代码并模拟每个级别的影响。这个问题经常出现在这个论坛 - 这是一个很好的分析
- 在我看来,如何处理丢失的数据是完全不同的事情。我的理解是,成对删除不被视为多元回归的有效方法。Listwise 很常见,但也可能使结果产生偏差,这当然是一种耻辱。多重插补是一件美丽的事情。
您绝对可以,按照您用于第一个分类预测器的相同方法。就像创建第一个此类变量一样创建虚拟变量。但使用 SPSS 的 Unianova 命令通常更容易。您可以在任何印刷或 pdf 格式的语法指南中查找它,或者您可以通过分析...通用线性模型...单变量来访问它。
尽管有点复杂,但回归命令比 Unianova 有许多优势。最主要的是您可以选择“成对缺失”(您不必仅仅因为它缺少一个或两个预测变量的值而输掉一个案例)。您还可以获得许多有价值的诊断信息,例如部分图和影响统计。
将分类变量转换为一组虚拟变量以用于 SPSS 中的模型的一种简单方法是使用 do repeat 语法。如果您的分类变量按数字顺序排列,这是最简单的使用方法。
*making vector of dummy variables.
vector dummy(3,F1.0).
*looping through dummy variables using do repeat, in this example category would be the categorical variable to recode.
do repeat dummy = dummy1 to dummy3 /#i = 1 to 3.
compute dummy = 0.
if category = #i dummy = 1.
end repeat.
execute.
否则,您可以简单地运行一组 if 语句来创建您的虚拟变量。我当前的版本 (16) 没有在回归命令中自动指定一组虚拟变量的本机能力(就像您可以在 Stata 中使用xi 命令一样)但如果这在某些较新版本中可用,我不会感到惊讶。还要注意 dmk38 的第 2 点,这种编码方案是假设名义类别。如果您的变量是序数,则可以使用更多的自由裁量权。
我也同意 dmk38 和关于回归更好的讨论,因为它能够以特定方式指定缺失数据是一个完全独立的问题。
其它你可能感兴趣的问题