Akaike 信息标准是否与卡方统计量成反比?

机器算法验证 卡方检验 aic
2022-04-03 20:22:15

我正在为一组 15 个嵌套模型计算 akaike 信息标准 (AIC)。数据由第 5 个模型生成,并用于所有模型的参数估计。该数据是来自一组 ODE 的时间过程数据,由两个不同初始条件下的 4 个变量组成。因此观测值。我的任务是推断数据是使用 AIC 从第 5 个模型生成的。我使用的 AIC 表格是:2431=248

Nln[(RSS/N)]+2k+[(2k(k+1))/(Nk1)]
其中:

N:观察次数(在我的情况下为 248)

k:估计参数的数量加 1(因为误差显然是一个参数)。

以下是我的计算结果(从 Matlab 复制)。如您所见,估计将系列中的第 5 个模型确定为仅是第 2 个最佳选项(通过最小化平方和)。然后我开始单独计算每个 AIC 项,然后在最后求和。

我观察到的是,卡方排名第一的模型在 AIC 中排名最后。此外,卡方和 AIC 之间似乎存在反比关系,因为卡方排名第二的最佳模型是 AIC 排名第二的最差模型,依此类推。

我的问题是:以前是否观察到过这种性质的关系?如果是这样,在哪里,如果不是(我怀疑是这种情况)我做错了什么?

chisq      chisq_rank num_parameters  1st_term  2nd_term   3rd_term    AIC (sum)
1.60175856506195    9   8   1250.49700109714    16  0.602510460251046   1267.09951155739    7
2.22401333127733    15  8   1169.10061312778    16  0.602510460251046   1185.70312358803    1
2.21538124402173    13  10  1170.06505109382    20  0.928270042194093   1190.99332113601    3
1.50205042169781    8   9   1266.43621067286    18  0.756302521008403   1285.19251319387    8
0.593373856737609   2   9   1496.76912499725    18  0.756302521008403   1515.52542751826    14
1.26848304390402    4   10  1308.35053928393    20  0.928270042194093   1329.27880932612    12
0.593367670012715   1   10  1496.77171074611    20  0.928270042194093   1517.69998078830    15
2.22098980957599    14  8   1169.43799579043    16  0.602510460251046   1186.04050625068    2
1.45989299143802    6   8   1273.49627045328    16  0.602510460251046   1290.09878091353    10
2.01998433198069    10  9   1192.96406982433    18  0.756302521008403   1211.72037234534    6
2.02269351982039    11  9   1192.63167693553    18  0.756302521008403   1211.38797945654    5
1.04998188601805    3   8   1355.23464672182    16  0.602510460251046   1371.83715718207    13
2.03684592732117    12  9   1190.90250971104    18  0.756302521008403   1209.65881223205    4
1.50205035842807    7   9   1266.43622111918    18  0.756302521008403   1285.19252364019    9
1.30853041112627    5   9   1300.64196743421    18  0.756302521008403   1319.39826995522    11
1个回答

对照 Wikipedia AIC 页面检查您的 AIC 公式,equal-variances case第一个任期之前的负号似乎是错误的。(维基百科页面的那部分省略了从 AIC 到 AICc 的更正,这是方程的第三项,在该页面的上方进行了讨论。)

可能会出现一些混淆,因为计算出的 AIC 值会显示为负数,这似乎是错误的。这是因为您打算使用的公式省略了一个常数,如 Wikipedia 页面上所述。对于同一数据集上的模型比较,可以忽略常数,您仍然可以根据计算得出的最低 AIC 进行选择。

另外,请注意,您的模型不是通常意义上的嵌套模型,因为许多模型具有相同数量的参数。通常,“嵌套”术语是指一组模型,在第一个模型中具有一大组预测变量,第二个模型仅包含这些预测变量的适当子集,第三个模型包含第二个模型中的预测变量子集,以及以此类推,预测变量的数量严格递减。因此,一组嵌套模型中不可能有 2 个具有相同数量的预测变量。正如此 Cross-Validated page所指出的,对于非嵌套模型的 AIC 有效性存在一些争议