机器算法验证 - 当CFA适合多项目规模不好时怎么办？ - 吾爱随笔录

当CFA适合多项目规模不好时怎么办？

机器算法验证 r 结构方程建模配件确认因素

2022-03-10 04:54:20

我不确定如何继续我在 lavaan 做的这个 CFA。我有一个包含 172 名参与者的样本（我知道这对于 CFA 来说并不多）和 28 项带有 7 点李克特量表的项目，应该加载到七个因素上。我用“mlm”-估计器做了一个 CFA，但模型拟合真的很差 (χ2(df=329)=739.36；比较拟合指数 (CFI)= .69；标准化均方根残差 (SRMR)=.10；近似的均方根误差 (RMSEA)=.09；RMSEA 90% 置信区间 (CI) = [.08, .10])。

我尝试了以下方法：

具有一种通用方法因子的双因子模型 -> 未收敛。
序数数据的估计量 (“WLSMV”) —> 模型拟合：(χ2(df=329)=462；比较拟合指数 (CFI)= .81；标准化均方根残差 (SRMR)=.09；均方根误差近似值 (RMSEA)=.05；RMSEA 90% 置信区间 (CI) = [.04, .06])
通过加载低因子的项目减少模型并在特定项目之间添加协方差 --> 模型拟合：χ2(df=210)=295; 比较拟合指数 (CFI)= .86；标准化均方根残差 (SRMR)=.08；逼近均方根误差 (RMSEA)=.07；RMSEA 90% 置信区间 (CI) = [.06, .08]。

现在我的问题：

我应该如何处理这样的模型？
统计上正确的做法是什么？
报告它适合还是不适合？这些模型中的哪一个？

我很高兴与您讨论这个问题。

这是原始模型的 CFA 的 lavaan 输出：

    lavaan (0.5-17.703) converged normally after  55 iterations

                                              Used       Total
  Number of observations                           149         172

  Estimator                                         ML      Robust
  Minimum Function Test Statistic              985.603     677.713
  Degrees of freedom                               329         329
  P-value (Chi-square)                           0.000       0.000
  Scaling correction factor                                  1.454
    for the Satorra-Bentler correction

Model test baseline model:

  Minimum Function Test Statistic             2461.549    1736.690
  Degrees of freedom                               378         378
  P-value                                        0.000       0.000

User model versus baseline model:

  Comparative Fit Index (CFI)                    0.685       0.743
  Tucker-Lewis Index (TLI)                       0.638       0.705

Loglikelihood and Information Criteria:

  Loglikelihood user model (H0)              -6460.004   -6460.004
  Loglikelihood unrestricted model (H1)      -5967.202   -5967.202

  Number of free parameters                        105         105
  Akaike (AIC)                               13130.007   13130.007
  Bayesian (BIC)                             13445.421   13445.421
  Sample-size adjusted Bayesian (BIC)        13113.126   13113.126

Root Mean Square Error of Approximation:

  RMSEA                                          0.116       0.084
  90 Percent Confidence Interval          0.107  0.124       0.077  0.092
  P-value RMSEA <= 0.05                          0.000       0.000

Standardized Root Mean Square Residual:

  SRMR                                           0.096       0.096

Parameter estimates:

  Information                                 Expected
  Standard Errors                           Robust.sem

                   Estimate  Std.err  Z-value  P(>|z|)   Std.lv  Std.all
Latent variables:
  IC =~
    PTRI_1r           1.000                               1.093    0.691
    PTRI_7            1.058    0.118    8.938    0.000    1.156    0.828
    PTRI_21           0.681    0.142    4.793    0.000    0.744    0.582
    PTRI_22           0.752    0.140    5.355    0.000    0.821    0.646
  IG =~
    PTRI_10           1.000                               0.913    0.600
    PTRI_11r          0.613    0.152    4.029    0.000    0.559    0.389
    PTRI_19           1.113    0.177    6.308    0.000    1.016    0.737
    PTRI_24           0.842    0.144    5.854    0.000    0.769    0.726
  DM =~
    PTRI_15r          1.000                               0.963    0.673
    PTRI_16           0.892    0.118    7.547    0.000    0.859    0.660
    PTRI_23           0.844    0.145    5.817    0.000    0.813    0.556
    PTRI_26           1.288    0.137    9.400    0.000    1.240    0.887
  IM =~
    PTRI_13           1.000                               0.685    0.609
    PTRI_14           1.401    0.218    6.421    0.000    0.960    0.814
    PTRI_18           0.931    0.204    4.573    0.000    0.638    0.604
    PTRI_20r          1.427    0.259    5.514    0.000    0.978    0.674
  IN =~
    PTRI_2            1.000                               0.839    0.612
    PTRI_6            1.286    0.180    7.160    0.000    1.080    0.744
    PTRI_12           1.031    0.183    5.644    0.000    0.866    0.523
    PTRI_17r          1.011    0.208    4.872    0.000    0.849    0.613
  EN =~
    PTRI_3            1.000                               0.888    0.687
    PTRI_8            1.136    0.146    7.781    0.000    1.008    0.726
    PTRI_25           0.912    0.179    5.088    0.000    0.810    0.620
    PTRI_27r          1.143    0.180    6.362    0.000    1.015    0.669
  RM =~
    PTRI_4r           1.000                               1.114    0.700
    PTRI_9            0.998    0.105    9.493    0.000    1.112    0.786
    PTRI_28           0.528    0.120    4.403    0.000    0.588    0.443
    PTRI_5            0.452    0.149    3.037    0.002    0.504    0.408

Covariances:
  IC ~~
    IG                0.370    0.122    3.030    0.002    0.371    0.371
    DM                0.642    0.157    4.075    0.000    0.610    0.610
    IM                0.510    0.154    3.308    0.001    0.681    0.681
    IN                0.756    0.169    4.483    0.000    0.824    0.824
    EN                0.839    0.169    4.979    0.000    0.865    0.865
    RM                0.644    0.185    3.479    0.001    0.529    0.529
  IG ~~
    DM                0.380    0.103    3.684    0.000    0.433    0.433
    IM                0.313    0.096    3.248    0.001    0.501    0.501
    IN                0.329    0.107    3.073    0.002    0.429    0.429
    EN                0.369    0.100    3.673    0.000    0.455    0.455
    RM                0.289    0.116    2.495    0.013    0.284    0.284
  DM ~~
    IM                0.530    0.120    4.404    0.000    0.804    0.804
    IN                0.590    0.122    4.839    0.000    0.731    0.731
    EN                0.588    0.105    5.619    0.000    0.688    0.688
    RM                0.403    0.129    3.132    0.002    0.376    0.376
  IM ~~
    IN                0.439    0.126    3.476    0.001    0.763    0.763
    EN                0.498    0.121    4.128    0.000    0.818    0.818
    RM                0.552    0.122    4.526    0.000    0.723    0.723
  IN ~~
    EN                0.735    0.167    4.402    0.000    0.987    0.987
    RM                0.608    0.141    4.328    0.000    0.650    0.650
  EN ~~
    RM                0.716    0.157    4.561    0.000    0.724    0.724


Variances:
    PTRI_1r           1.304    0.272                      1.304    0.522
    PTRI_7            0.613    0.153                      0.613    0.314
    PTRI_21           1.083    0.199                      1.083    0.662
    PTRI_22           0.940    0.141                      0.940    0.582
    PTRI_10           1.483    0.257                      1.483    0.640
    PTRI_11r          1.755    0.318                      1.755    0.849
    PTRI_19           0.868    0.195                      0.868    0.457
    PTRI_24           0.530    0.109                      0.530    0.473
    PTRI_15r          1.121    0.220                      1.121    0.547
    PTRI_16           0.955    0.200                      0.955    0.564
    PTRI_23           1.475    0.219                      1.475    0.691
    PTRI_26           0.417    0.120                      0.417    0.213
    PTRI_13           0.797    0.113                      0.797    0.629
    PTRI_14           0.468    0.117                      0.468    0.337
    PTRI_18           0.709    0.134                      0.709    0.635
    PTRI_20r          1.152    0.223                      1.152    0.546
    PTRI_2            1.178    0.251                      1.178    0.626
    PTRI_6            0.942    0.191                      0.942    0.447
    PTRI_12           1.995    0.235                      1.995    0.727
    PTRI_17r          1.199    0.274                      1.199    0.625
    PTRI_3            0.882    0.179                      0.882    0.528
    PTRI_8            0.910    0.131                      0.910    0.472
    PTRI_25           1.048    0.180                      1.048    0.615
    PTRI_27r          1.273    0.238                      1.273    0.553
    PTRI_4r           1.294    0.242                      1.294    0.510
    PTRI_9            0.763    0.212                      0.763    0.382
    PTRI_28           1.419    0.183                      1.419    0.804
    PTRI_5            1.269    0.259                      1.269    0.833
    IC                1.194    0.270                      1.000    1.000
    IG                0.833    0.220                      1.000    1.000
    DM                0.927    0.181                      1.000    1.000
    IM                0.470    0.153                      1.000    1.000
    IN                0.705    0.202                      1.000    1.000
    EN                0.788    0.177                      1.000    1.000
    RM                1.242    0.257                      1.000    1.000

2个回答

1. 回到探索性因素分析

如果你的 CFA 成绩非常差，那么这通常表明你跳得太快了 CFA。你应该回到探索性因素分析来了解你的测试结构。如果您有一个大样本（在您的情况下没有），那么您可以将您的样本拆分为一个探索性样本和一个确认性样本。

应用探索性因素分析程序来检查理论化的因素数量是否合理。我会检查碎石图，看看它暗示了什么。然后，我将使用理论化的因子数量以及一两个更多和一两个更少的因子来检查旋转的因子加载矩阵。通过查看此类因子加载矩阵，您通常可以看到因子提取不足或过度提取的迹象。
使用探索性因素分析来识别有问题的项目。特别是，在非理论因素上加载最多的项目、具有大量交叉加载的项目、在任何因素上加载不高的项目。

EFA 的好处在于它提供了很大的自由度，因此与仅查看 CFA 修改指数相比，您将学到更多关于考试结构的知识。

无论如何，希望从这个过程中您可能已经确定了一些问题和解决方案。例如，您可能会丢弃一些物品；您可能会更新您的理论模型，了解有多少因素等等。

2. 改进验证性因子分析拟合

这里可以提出很多观点：

CFA 在每个量表有很多项目的量表上，按照传统标准通常表现不佳。这通常会导致人们（并注意我认为这种反应通常是不幸的）形成项目包裹或每个规模只使用三到四个项目。问题在于，通常提出的 CFA 结构无法捕捉数据中的细微差别（例如，小的交叉加载、测试中的项目比其他项目相关性稍高、轻微的干扰因素）。这些被放大了每个尺度的许多项目。

以下是对上述情况的一些回应：

做探索性 SEM，允许各种小的交叉加载和相关术语
检查修改指数并纳入一些最大的合理修改；例如，一些规模相关的残差；一些交叉加载。见。modificationindices(fit)_lavaan
使用项目分割来减少观察变量的数量

普通的留言

所以总的来说，如果你的 CFA 模型真的很差，请返回 EFA 以了解更多关于你的量表的信息。或者，如果您的 EFA 很好，并且由于众所周知的每个量表有很多项目的问题，您的 CFA 看起来有点糟糕，那么上面提到的标准 CFA 方法是合适的。

我会努力让双因子模型收敛。尝试调整起始值……但这可能是一种可疑的方法，因此请记住这一点并谨慎解释。如果您想真正谨慎，请阅读解释抵抗收敛的模型的危险——我承认我自己在研究 SEM 时还没有做这么多，所以我建议做你需要做的事情来让模型收敛主要是为了你的利益。我不知道它是否更适合出版，但如果它显然不是因为双因子模型也不适合，那可能对你有好处。

否则，您似乎已经尽可能多地使用您拥有的数据。AFAIK（我最近一直在深入研究这个我自己的方法项目，所以如果我错了，请纠正我！！），WLSMV 估计lavaan使用来自多变量相关的阈值，这是获得良好拟合的最佳方法来自序数数据的 CFA 的索引。假设您已正确（或至少以最佳方式）指定了模型，这就是您所能做的。删除低负载的项目并自由估计项目间的协方差甚至有点远，但你也尝试过。

正如您可能知道的那样，您的模型不适合传统标准。当然，你不应该说它不合适。不幸的是，这适用于您在此处报告的所有适合统计数据集（我假设您希望它适合）。你的一些拟合统计数据只是相当差，不是完全差（RMSEA = .05 是可以接受的），但总的来说，这都不是好消息，如果你要发布，你有责任诚实这些结果。我希望你能，FWIW。

无论哪种方式，如果可以，您都可以考虑收集更多数据；这可能会有所帮助，具体取决于您所追求的。如果您的目标是验证性假设检验，那么您已经“窥视”了您的数据，并且如果您在扩展样本中重复使用它会增加错误率，所以除非您可以将这个数据集放在一边并复制一个整体，新鲜的，更大的，你有一个艰难的场景要处理。如果您最感兴趣的是估计参数和缩小置信区间，我认为汇集尽可能多的数据可能是合理的，包括您已经在此处使用的任何数据。如果您可以获得更多数据，您可能会获得更好的拟合指数，这将使您的参数估计更可靠。希望这已经足够好了。

其它你可能感兴趣的问题

上一篇术语“指数族”是什么意思？为什么会这样命名？下一篇帮助创建图表以随时间显示分类数据