我正在使用多个变量进行线性回归。在我的数据中,我有n = 143 个特征和m = 13000个训练示例。我的一些特征是连续(有序)变量(面积、年份、房间数量)。但我也有分类变量(区域、颜色、类型)。现在,我将我的一些功能与预测价格进行了可视化。例如,这是area针对预测的图price:

由于area是连续的序数变量,我可以毫无困难地可视化数据。但现在我想以某种方式可视化我的分类变量(例如地区)对预测价格的依赖性。对于分类变量,我使用单热(虚拟)编码。
例如那种数据:

如果我以这种方式对区域使用序数编码:
DistrictA - 1
DistrictB - 2
DistrictC - 3
DistrictD - 4
DistrictE - 5
通过将 1-5 放在 X 轴并将价格放在 Y 轴上,我可以很容易地根据预测价格绘制这个值。
但是我使用了虚拟编码,现在我不知道如何显示(可视化)价格和分类变量“地区”之间的依赖关系,表示为一系列零和一。
在使用虚拟编码的情况下,如何绘制显示区域回归线与预测价格的图?
