我正在处理一个大型的行为数据数据集,我将其(事后)视为时间序列实验设计,以寻找单个因变量作为治疗结果的可靠变化。数据来自用户与网站超过 10 年的互动。从时间 1 到时间 2 有一个整体改善,p<.001。但是平均效应有一个回归(也见这里),即在时间 1 具有低 DV 的那些在时间 2 增加,而在时间 1 具有高 DV 的那些在时间 2 减少。(这可以在图表上清楚地看到。 ) 我不知道如何进行分析。我可以量化回归到平均效应并从中确定治疗效果如何超过回归效应?
以下是有关该研究的一些其他详细信息:
该研究的数据来自一个支持小组网站,用户在该网站上写下生活问题。志愿辅导员阅读条目并以支持和建议回应用户。有10年的数据;n=~200,000。
我的研究是一项自然实验,因为它使用的网站数据并非出于研究目的而收集的。最大的问题是:没有对照组。
志愿顾问还(私下)用主题、属性和严重性标签标记用户的书面条目。我对辅导员进行了一项调查,要求他们对这些标签的相对严重程度进行评分(例如,“抑郁-恐慌”~0、“学校担忧”~2、“关系快乐”~5)。调查结果和应用于每个写作条目的标签用于导出用户在写作时的状态的简单代理。该代理在整个样本中进行了归一化,具有准正态分布,并被视为 IV。
治疗只是使用网站(写生活问题和接受社会支持),所以 DV 从写条目 1 到条目 2。主要效果是 IV 确实从条目 1 到 2 整体增加,但如上所述有一个回归到平均效应。
建立主效应后,我有兴趣研究各种交互变量:用户的语言选择、网站交互的细节、辅导员响应的时间等。