这可能会成为这个论坛上有史以来最愚蠢的问题,但是在收到对前一个问题的合理而有意义的答案后,我想我会再次延长我的运气。
一段时间以来,我一直对统计分布的重要性感到非常困惑,特别是因为它们与资产回报有关,尤其是在资产配置中。
我要具体的问题是:假设我有 20 年的标准普尔 500 指数月度回报数据,为什么我需要为我的资产分配决策假设某种分布(即正常/约翰逊/征费等),而我可以简单地只是根据我拥有的历史数据做出资产配置决定?
这可能会成为这个论坛上有史以来最愚蠢的问题,但是在收到对前一个问题的合理而有意义的答案后,我想我会再次延长我的运气。
一段时间以来,我一直对统计分布的重要性感到非常困惑,特别是因为它们与资产回报有关,尤其是在资产配置中。
我要具体的问题是:假设我有 20 年的标准普尔 500 指数月度回报数据,为什么我需要为我的资产分配决策假设某种分布(即正常/约翰逊/征费等),而我可以简单地只是根据我拥有的历史数据做出资产配置决定?
使用假设分布(即参数分析)将降低您的方法的计算成本。我假设您想要执行回归或分类任务。这意味着在某些时候您将估计某些数据的分布。当数据不符合经过充分研究的分布时,非参数方法很有用,但它们通常需要更多时间来计算或更多内存来存储。
此外,如果数据是由符合分布的过程生成的,例如它们是一些均匀随机过程的平均值,那么使用该分布更有意义。在对一组均匀变量进行平均的情况下,正确的分布可能是高斯分布。
补充詹姆斯的回答:参数模型也(通常)需要更少的样本才能获得良好的拟合:这可能会增加它们的泛化能力:也就是说,它们可以更好地预测新数据,甚至是错误的。当然,这取决于具体情况、模型和样本量。