我目前正在研究救护车数据集,我的任务之一是找出患者何时被呼叫调度员误诊。
我有两个代码;调度代码(调度员认为患者有什么问题)和医院代码(医生决定实际诊断在医院的代码)
我正在寻找一种可视化两个代码之间关系的方法,即给定救护车代码 x 每个救护车代码成为结果的概率是多少。
这可以很容易地使用 SQL 计算,但我正在寻找一种可视化/集群的方法,这会很棒。任何帮助,将不胜感激。
编辑:评论中有一些很好的反馈
首先是维度:调度代码可以采用 1722 个唯一值中的 1 个
医院代码可以采用 1058 个唯一值中的 1 个
这两个代码完全不同,一个例子如下
Dispatcher 17D03:Unconscious
Hospital R41:Other symptoms and signs involving cognitive functions and awareness
我的兴趣是可视化这种关系。例如,给定一个无意识的调度员代码,最常见的医院代码是什么?
同样,这很容易用数字计算,但可视化会更容易向我的利益相关者解释。

