数据有限系统的统计学习

数据挖掘 机器学习 统计数据
2022-03-01 23:20:36

我目前正在审查用于热带内陆渔业的定量方法。热带内陆渔业建模方法的主要问题之一是缺乏可用数据。对于分布广泛的小规模渔业,渔业评估很困难。由于生活在热带地区的许多人都是自给渔民,他们直接食用鱼,而没有任何渔获记录。

我正在尝试找到能够处理数据受限系统的统计/数学建模方法。我没有统计学方面的重要背景,但我对“统计学习”的概念和一般的数据科学方法感到好奇。我对数据科学(机器学习、人工智能)当前“热门”话题的理解是它们对大数据很有用。我还没有发现它们在数据有限的方法中的用处。尽管他们似乎可以通过使用一系列其他可用数据来对受限数据的状态做出假设来潜在地处理数据限制。你知道统计学习或数据科学方法对数据有限系统有什么用处吗?谢谢!

2个回答

这真的取决于手头的数据集。例如,对于短时间序列,您可以查看此线程

一般来说,我会说非参数统计对于较小的数据集非常有效。

问题是——你想回答什么。这将决定你如何解决问题。你对热带鱼的寿命感兴趣吗?生存分析将是您的答案,它具有处理数据限制的方法。其他目标将需要其他方法