语境:
我正在使用序数逻辑模型并尝试解释/呈现结果。该模型有两个连续的兴趣预测变量,以及连续和分类控制的混合。我希望在我感兴趣的多个级别的 IV 中绘制出最佳结果(被学校录取)的预测可能性。
我正在使用 R 的 predict() 函数来生成预测的可能性。对于我感兴趣的 IV,我选择了一系列合理的值(即平均值 +- 1 SD)。对于连续预测变量,我可以使用合理的基线值(通常为 0),因为它们是以均值为中心或标准化的。
我正在尝试研究如何处理分类预测变量。我通过插入不同的值来探索我的选择,在大多数情况下,结果只是输出曲线的一个小变化。然而,对于一个变量,差异是巨大的,所以我需要找到一种方法来呈现该变量不同级别的通用结果。
也许一个例子可以帮助澄清。在这两个图中,两个感兴趣的 IV 绘制在 x 轴上并作为 3 条线绘制。每个图表都显示了给定我麻烦的分类控制的单个级别的输出,“录取学校”(总共有 4 个级别)
问题:
- 我应该如何在单个图中表示所有级别的分类变量的模型?
初步想法:
- 使用某种加权平均值汇总每个入学学校级别的预测值。
- 这篇文章建议使用每种类型的案例比例作为每个变量的输入。例如,如果我 32% 的案例来自学校 1,我将在预测公式中使用 .32*B-school1。我不知道如何在 R 中做到这一点,因为这些变量是因素,但如果它是一种适当的方法,我相信我可以弄清楚。
抱歉冗长,并在此先感谢您的帮助。