我有一个包含患者人口统计数据、诊断历史、医院就诊日期、药物消耗等的数据集。
所有这些事件都有时间戳信息(除了静态信息,如性别、年龄、教育等人口统计数据)。
我的目标是根据他以前的医院记录(如就诊信息、药物信息、人口统计数据、诊断信息等)预测接下来的 3 次医院就诊和他接下来 3 次就诊的风险因素。
这里的专家可以让我知道我需要遵循的步骤列表,以便我可以学习并尝试实现我的项目目标吗?
我有一个包含患者人口统计数据、诊断历史、医院就诊日期、药物消耗等的数据集。
所有这些事件都有时间戳信息(除了静态信息,如性别、年龄、教育等人口统计数据)。
我的目标是根据他以前的医院记录(如就诊信息、药物信息、人口统计数据、诊断信息等)预测接下来的 3 次医院就诊和他接下来 3 次就诊的风险因素。
这里的专家可以让我知道我需要遵循的步骤列表,以便我可以学习并尝试实现我的项目目标吗?
您需要定义每个时间序列块中需要多少时间步长。然后对于每个独特的患者,您需要创建这些块,以便训练集成为 3D 矩阵,尺寸为:
块数 * 时间步数 * 特征数
除了时间序列数据之外,您还可以添加另一个头来为 NN 提供诸如患者 ID、星期几和...等常量数据。
对于时间序列部分,您可以使用 biLSTM 或 biGRU 或其他 RNN 层,然后使用 Dense 层,然后将结果与来自常量特征的结果连接起来。
对于输出,您还可以使用 RNN 层来预测未来访问的顺序,或者简单地使用 Dense 层。
===============已更新
考虑下面的流程图
如果您的其他特征(如药物、实验室测试)没有相同的时间结构,请将其视为时间序列组,并为每组添加其他头以及具有不同输入形状的 RNN(时间步数)。关键是将所有特征带到潜在空间,然后从那里进行解码并预测未来的序列。
