我有一个嵌套在医院中的患者的生存模型,其中包括医院的随机效应。随机效应是伽马分布的,我试图以易于理解的规模报告该术语的“相关性”。
我找到了以下使用中值风险比(有点像中值优势比)的参考资料,并计算了这一点。
Bengtsson T, Dribe M:历史方法 43:15, 2010
但是,现在我希望使用 bootstrap 报告与此估计相关的不确定性。数据是生存数据,因此每个患者有多个观察结果,每个医院有多个患者。很明显,我需要在重新采样时对患者的观察结果进行聚类。但我不知道我是否也应该对医院进行聚类(即重新抽样医院,而不是病人?
我想知道答案是否取决于感兴趣的参数,如果目标是与患者级别而不是医院级别相关的东西,那么会有所不同吗?
我在下面列出了stata代码以防万一。
cap program drop est_mhr
program define est_mhr, rclass
stcox patient_var1 patient_var2 ///
, shared(hospital) ///
noshow
local twoinvtheta2 = 2 / (e(theta)^2)
local mhr = exp(sqrt(2*e(theta))*invF(`twoinvtheta2',`twoinvtheta2',0.75))
return scalar mhr = `mhr'
end
bootstrap r(mhr), reps(50) cluster(hospital): est_mhr