“更好”是您的模型的一个功能。
您感到困惑的部分原因是您只写了一半的模型。
当你说y=axb,这实际上不是真的。你观察到的y值不等于axb; 他们有一个错误组件。
例如,您提到的两个模型(无论如何都不是唯一可能的模型)对错误做出完全不同的假设。
你可能意味着更接近E(Y|X=x)=axb.
但是,那么我们怎么说Y在给定的情况下偏离期望x? 很重要!
当您拟合非线性最小二乘模型时,您是在说误差是相加的,并且误差的标准偏差在数据中是恒定的:
yi∼N(axbi,σ2)
或等效地
yi=axbi+ei, 和var(ei)=σ2
相比之下,当您采用对数并拟合线性模型时,您是在说误差在对数尺度上是相加的,并且(在对数尺度上)数据中的常数。这意味着在观测的尺度上,误差项是相乘的,因此当期望值越大时误差越大:
yi∼logN(loga+blogxi,σ2)
或等效地
yi=axbi⋅ηi, 和ηi∼logN(0,σ2)
(注意E(η)不是 1。如果σ2不是很小,如果您想要一个合理的近似值Y)
(您可以在不假设正态/对数正态分布的情况下进行最小二乘,但讨论的中心问题仍然适用……如果您离正态还差得很远,您可能应该考虑使用不同的误差模型)
所以最好的取决于哪种错误模型描述了您的情况。
[如果您正在对某种以前从未见过的数据进行探索性分析,您会考虑诸如“您的数据是什么样的?(即y密谋反对x? 残差看起来像什么x?”。另一方面,如果像这样的变量并不少见,您应该已经了解了它们的一般行为。]