我相信每个试图在历史股市数据或投注历史中寻找模式的人都想知道这一点。给定大量数据,以及可能会或可能不会影响数据的数千个随机变量,询问您从数据中提取的任何模式确实是真实模式而不是统计侥幸是有意义的。
许多模式只有在样本中测试时才有效。当你在现实世界中应用它时,即使是那些在样本中有效的模式也可能不再有效。
我知道不可能完全 100% 确保模式始终有效,但除了样本内外测试之外,他们是否有任何测试可以确定模式的有效性?
我相信每个试图在历史股市数据或投注历史中寻找模式的人都想知道这一点。给定大量数据,以及可能会或可能不会影响数据的数千个随机变量,询问您从数据中提取的任何模式确实是真实模式而不是统计侥幸是有意义的。
许多模式只有在样本中测试时才有效。当你在现实世界中应用它时,即使是那些在样本中有效的模式也可能不再有效。
我知道不可能完全 100% 确保模式始终有效,但除了样本内外测试之外,他们是否有任何测试可以确定模式的有效性?
如果您想知道一个模式是否有意义,您需要展示它的实际含义。统计测试不这样做。除非您的数据在某种意义上可以说是“完整的”,否则从数据中得出的推论将始终是临时的。
您可以通过针对越来越多的样本数据进行测试来增加您对模式有效性的信心,但这并不能保护您免于被证明是人工制品。您的样本数据范围越广——例如,就如何获取数据以及其中可能存在什么样的系统性混杂因素而言——验证效果就越好。
但是,理想情况下,您需要超越识别模式并提出一个有说服力的理论框架来解释您发现的模式,然后通过其他独立的方式对其进行测试。(这被称为“科学”。)
这里讨论了一种测试股票市场数据模式的方法。一种类似的方法是将股票市场数据随机化并确定您感兴趣的模式,由于故意的随机化过程,这显然没有任何意义。这些随机生成的模式及其回报将构成您的零假设。通过将实际数据中的模式返回与零假设随机数据模式的返回进行统计比较,您可能能够区分实际上具有某种意义或预测价值的模式。