测量设计卡方

机器算法验证 r 卡方检验 民意调查
2022-03-19 12:39:15

svydesign()如果变量来自具有不同陈述的不同调查,有谁知道用卡方检验比较两个变量的方法?我希望测试两波调查中变量分布的差异,但该svychisq()陈述仅限于一个设计对象。

将两个变量堆叠在一个 new中data.frame,使用集体权重创建一个新svydesign语句然后运行测试是否合法?

1个回答

如果你走的是数据集堆叠在一起的路径,那么你应该定义对应于两个数据集/波的超层,这样就svydesign()知道它们是独立的。因此,您的新svydesign将具有分层 = 年份和分层的交叉、原始设计的 PSU 以及原始设计的权重。

正如我在评论中所建议的那样,文献中已经提出了其他组合估计和测试的方法。Wu (2004) 基于两个数据集之间的共同变量使用经验似然。

对于连续变量,理想情况下,您可能希望对“平面”数据使用 Kolmogorov-Smirnov 检验,但我不知道它的扩展是否适用于调查数据;我对此表示怀疑。因此,您可能必须将连续变量转换为序数变量[log2(n)]变量范围的百分位数组或等宽 bin(其中样本大小的上述函数是直方图常用的 bin 数),并应用 Rao-Scottχ2给他们。