在科学论文中报告曲线拟合结果

计算科学 回归 出版物
2021-12-20 03:59:58

(我希望这个问题适合这个网站;如果不是,请接受我的道歉)。

我跑了一个模拟,得到了一个时间序列 y(t), t = 0, 1, ... 20。在尝试了一些函数后,我发现:

y(t) =~ 1 / (A t + B)

其中 A 和 B 是我使用线性回归计算的系数,R^2 > 0.99。

在科学论文中报告此类结果的标准方法是什么?具体来说:

A. 我没有理论上的解释,为什么输出看起来像这样(我知道它应该是减少的,并且它是从下面限制的,但仅此而已)。这只是一个成功的猜测。我应该描述我尝试过的所有其他不成功的猜测吗?

B. 每当我运行模拟时,我得到的 A 和 B 的值略有不同。我应该只报告随机运行,还是应该多次运行模拟并平均结果?如果是这样,多少次就足够了?

2个回答

关于你的问题的一些想法:

  • 你如何报告你的模型适合度在很大程度上取决于你的受众和你的领域。例如,在我的领域中,像 R^2 这样的模型拟合统计数据很少被报道——被认为既不令人印象深刻也不特别有用。相反,往往会描述一些关于您如何获得模型的标准,然后您报告您的模型结果——我们都假设您实际上正确地拟合了模型。
  • “我碰巧遇到了这种形式”是一个不好的解释。一个非常糟糕的。尽管喜欢偶然天才的故事,比如发现青霉素或奎宁,但“盲目的愚蠢运气”并不是一个可靠的科学过程。例如,您已经证明该表格很适合您的数据,但您还没有证明它适合您的数据。单独的 R^2 不足以评估模型对数据的拟合程度。参见Anscombe 的四重奏
  • 正如@rcompton 所提到的,看起来您正在尝试在不知情的情况下拟合幂律分布,但即使您确实设法很好地拟合幂律,最好还是找到一些理由让您认为它是幂律. 随着时间的推移绘制 Y 可能就足够了,前往CrossValidated(或对统计数据更熟悉的大学/部门)并系统地检查可能会给您大致外观的分布。除了幂律分布之外,还有其他可能会给您带来更好的拟合。

您正在尝试将幂律与您的分布相匹配。很有意思。这些一直出现在图论社交网络许多其他地方。

这里这里有一些关于拟合数据的教程

另外,关于问题 A.,一个人购买土地的概率如何取决于他们已经拥有多少土地?您也许可以使用Barbasi 的模型来解释为什么幂律合理地适合您的数据。

更新:我用过这个,效果很好:https ://pypi.python.org/pypi/powerlaw