为建模准备数据

机器算法验证 回归 混合模式 造型
2022-04-08 08:11:46

通常,建模中使用的数据结构相对简单——每行一个主题。相比之下,我正在分析一个国家/地区的服务可访问性,每个地区代表一行数据。

我有(共 14 个)和年份(共 7 个)的医疗服务报价数据。我需要报告年份和当地人口调整后的估计值。

offer ~ year + population + (1 | county)

使用以下数据格式进行此类建模是否正确?

在此处输入图像描述

还是每个县都有多行数据的问题?我可以选择以不同的方式准备我的数据,例如,也可以按月。以不同的方式准备数据给了我不同的行数,可能导致更窄的置信区间。这种数据操作可能会导致哪些其他偏差?这里有什么好的做法?

1个回答

使用以下数据格式进行此类建模是否正确?

是的,型号:

offer ~ year + population + (1 | county)

调整每个内的重复措施county

还是每个县都有多行数据的问题?

不,这正是我们在这种情况下使用混合模型的原因。

以不同的方式准备数据给了我不同的行数,可能导致更窄的置信区间

我不知道你那是什么意思。这是适合混合模型所需的格式 - 每个测量单位一行(country在这种情况下)

这种数据操作可能会导致哪些其他偏差?

还有什么偏见?你没有提到任何与偏见有关的事情,我也没有,因为数据格式没有偏见。如上所述,您只需要准备数据以使每个测量单位有 1 行。如果您在科目中重复测量,那么您需要每个科目有一行。

这里有什么好的做法?

唯一做法是每个度量单位有一行。至少,我使用过的每个混合模型软件都是这种情况。