Marcos Lopez de Prado似乎是金融领域的知名机器学习专家。我离他的水平还很远,因为我还没有读完经济学博士,只有应用水平的统计知识。我遇到了Lopez de Prado 的一篇被广泛引用的论文。我不能说我完全理解所有的数学部分。但是论文中有一些主张,似乎与我迄今为止在统计学和经济学方面学到的东西完全矛盾,或者至少对我来说似乎不合逻辑。举一个具体的例子,请参阅Pitfall #4和Solution #4部分下的论文建议,通过对时间序列进行差分以使它们对于经典统计模型(ARIMA 等)是静止的,从而消除了序列的记忆,从而使它们失去了预测能力:
结论是,几十年来,大多数实证研究都在处理记忆被不必要地抹去的系列。这是一种危险做法的原因是,拟合无记忆序列可能会导致虚假模式,错误发现。顺便说一句,时间序列的这种过度微分可以解释为什么有效市场假说在学术界仍然如此盛行:没有记忆,序列就无法预测,研究人员可能会得出市场不可预测的错误结论。
在经济学中,确实有一个关于股票收益的简化理论模型,它假定它是一种无记忆的白噪声,价格(综合收益)遵循随机游走。但从经验的角度来看,据我了解,回报的无记忆属性仅与单个数据点本身有关,而不是整个系列。一个差异化的系列仍然应该有一个“集体”的记忆放在一起,它的信息与集成版本几乎相同,只是缺少一个恒定的值。所以它也应该具有相同的预测能力,不是吗?还是我,缺乏理解?