把我的问题放在上下文中,我是一名物理学家,但对统计学的了解有限,而且我对它的了解是 30 多年前的事。
我正在尝试学习块引导,因为该技术可能适合解决我正在处理的问题。我可以找到很多关于块引导数学的论文/书籍/信息,但我想首先找到块引导过程的一般描述,然后再“冒险”解决移动块引导、圆形块引导、固定块引导等问题,块长度,样本大小等。
我用 10000 个观察值(行)对相关数据、5 个变量(列)进行过采样,我想将其减少到大约 100 行数据。数据是一个时间序列,但不是连续的,并且其中也可能有来自不同位置的数据,这意味着您可以同时拥有不同的数据(如果后者是块引导的问题,我可以删除“重复”数据及时)。块引导将允许复制数据的相关性。
最终目标是将数据集减少到约 100 行数据,以便所有 5 个变量的完整数据集和缩减数据集的 pdf 和 cdf 都相同(在仍有待定义的最小误差范围内)。
问题:1)块引导能够做到这一点吗?2)这是完成的一步一步的过程是什么?我不希望有人在这里详细写出完整的过程,但也许有人已经放了一个 youtube 视频或一个“傻瓜引导”,我可以从那里开始。
我在这里查看了关于块引导的类似问题,并且有一个关于“在时间序列分析中了解块引导的资源”,但答案中的参考假设我仍然必须掌握统计知识。