如何衡量/争论趋势线与幂律的拟合优度?

机器算法验证 拟合优度 幂律
2022-02-05 22:55:05

我有一些数据试图拟合趋势线。我相信数据遵循幂律,因此将数据绘制在对数轴上寻找一条直线。这导致了一条(几乎)直线,因此在 Excel 中我为幂律添加了一条趋势线。作为一个统计新手,我的问题是,现在对我来说,从“这条线看起来很合适”到“数字属性x 证明该图符合幂律”的最佳方式是什么?

在 Excel 中,我可以得到一个 r 平方值,但鉴于我对统计的了解有限,我什至不知道这在我的具体情况下是否真的合适。我在下面添加了一张图片,显示了我在 Excel 中使用的数据图。我对 R 有一点经验,所以如果我的分析受到我的工具的限制,我愿意接受有关如何使用 R 改进它的建议。

替代文字

2个回答

请参阅 Aaron Clauset 的页面:

其中包含拟合幂律的代码链接(Matlab、R、Python、C++)以及您应该首先阅读的 Clauset 和 Shalizi 的论文。

您可能想先阅读报纸上的 Clauset 和 Shalizi 的博客文章:

最后一个链接的摘要可能是:

  • 许多分布在对数图上为您提供直线。

  • 滥用线性回归让婴儿高斯哭了。
    用最小二乘法在对数图上拟合一条线是个坏主意。

  • 使用最大似然估计缩放指数。
  • 使用拟合优度来估计缩放区域的开始位置。
  • 使用拟合优度检验来检查拟合优度。
  • 使用 Vuong 的测试来检查替代方案,并为失望做好准备。

如果您对双变量幂律函数(而不是单变量幂律分布)感兴趣,那么

沃顿等人。异速生长的双变量线拟合方法。” 生物学。修订版 81, 259-201 (2006)

是一个很好的参考。在这种情况下,回归是正确的做法,尽管可能会有一些更正(OLS 与 RMA 等),具体取决于您希望回归结果的含义。